Todos los mensajes de error y de advertencia se muestran en la consola del sistema,
si la hay, y se registran en el archivo /var/adm/messages. Los LED de error
situados en el panel frontal permanecen encendidos después de un cierre automático
del sistema, para facilitar el diagnóstico del problema.
El subsistema de supervisión también está diseñado para detectar errores de los
ventiladores. El sistema dispone de dos bandejas de ventilador principal, con un
total de cinco ventiladores individuales. Si se produce algún error en un ventilador,
el subsistema de supervisión detecta la anomalía, genera un mensaje de error, lo
registra en el archivo /var/adm/messages y enciende el LED de la bandeja de
ventilador correspondiente y el LED de error del sistema.
El subsistema de alimentación se supervisa de manera similar. El subsistema de
supervisión indica el estado de las salidas de CC de cada una de las fuentes de
alimentación analizando los registros de estado de las fuentes de alimentación
periódicamente.
Si se detecta un problema en una fuente de alimentación, se muestra un mensaje de
error en la consola del sistema y se registra en el archivo /var/adm/messages.
También se encienden los LED situados en cada una de las fuentes de alimentación
para indicar la existencia de anomalías.
Recuperación automática del sistema
En algunos casos, la recuperación automática del sistema (ASR) se entiende como
la capacidad de blindar el sistema operativo en caso de un error de hardware, lo
que permite que el sistema operativo permanezca encendido y en funcionamiento.
La implementación de ASR en el servidor Sun Fire V490 es diferente. ASR en el
servidor Sun Fire V490 permite el aislamiento automático de los errores y la
restauración del sistema operativo en caso de producirse errores o fallos no
graves en los componentes de hardware siguientes:
Procesadores
■
Módulos de memoria
■
Tarjetas y buses PCI
■
Subsistema FC-AL
■
Interfaz Ethernet
■
Interfaces USB
■
Interfaz serie
■
Si se produce un error de hardware de este tipo, las pruebas de diagnóstico basadas
en firmware aíslan el problema y marcan el dispositivo (mediante la interfaz de
cliente 1275, a través del árbol de dispositivos) como defectuoso o desactivado. A
continuación, el firmware OpenBoot desconfigura el dispositivo defectuoso y
reinicia el sistema operativo. Este proceso se produce automáticamente, siempre
que el sistema Sun Fire V490 pueda funcionar sin dicho componente.
22
Guía de administración del servidor Sun Fire V490 • octubre de 2005