La tecnología de reparación automática predictiva incluye los siguientes
componentes del servidor:
Procesador multinúcleo UltraSPARC T2 Plus
■
Memoria
■
Subsistema de E/S
■
El mensaje de consola de PSH proporciona la siguiente información sobre cada fallo
detectado:
Tipo
■
Severity
■
Descripción
■
Respuesta automatizada
■
Impact
■
Acción sugerida para el administrador de sistema
■
Introducción a SunVTS
En ocasiones, el servidor puede presentar problemas que no se pueden aislar
definitivamente en un determinado componente de hardware o software. En tales
casos, será útil ejecutar una herramienta de diagnóstico que comprueba
exhaustivamente el sistema mediante una completa batería de pruebas continuas.
El software SunVTS cumple esta función.
Introducción a la gestión de errores de POST
POST (power-on self-test) es un grupo de pruebas basadas en PROM que se ejecutan
cuando el servidor se enciende o se reinicia. POST comprueba la integridad de los
componentes críticos de hardware del servidor (CMP, memoria, y subsistema de E/S).
POST prueba los componentes críticos de hardware para verificar sus funciones
antes de que el sistema arranque y acceda al software. Si POST detecta un
componente defectuoso, lo desactiva automáticamente, evitando que el hardware
defectuoso pueda dañar el software. Si el sistema es capaz de funcionar sin el
componente desactivado, el sistema arrancará cuando POST haya terminado. Por
ejemplo, si uno de los núcleos del procesador es considerado defectuoso por POST,
ese núcleo se desactivará. El sistema arrancará y funcionará con los demás núcleos.
Puede utilizar POST como herramienta inicial de diagnóstico para el hardware del
sistema. En este caso, configure POST para que se ejecute en su modo máximo
(diag_mode=service, setkeyswitch=diag, diag_level=max) a fin de que
realice todas las pruebas y muestre todos los resultados.
Capítulo 2
Gestión de fallos
19