el software del subsistema de supervisión enciende el indicador de servicio
solicitado del sistema en los paneles frontal y posterior. Si el problema de la
temperatura continúa y alcanza un umbral crítico el sistema inicia un cierre
predeterminado del sistema. En el caso de error del controlador del sistema ALOM,
se usan los sensores de copia de seguridad para proteger el sistema de daños graves,
iniciando un cierre forzado del hardware.
Todos los mensajes de error y advertencia se envían a la consola del sistema y
se registran en el archivo /var/adm/messages. Los indicadores de servicio
solicitado colocados en el panel frontal permanecen iluminados después de un
cierre automático del sistema, para facilitar el diagnóstico del problema.
El subsistema de supervisión también está diseñado para detectar errores de los
ventiladores. El sistema dispone de seis bandejas de ventilador que contienen un
ventilador. Cuatro ventiladores son para enfriar los módulos de memoria y CPU y dos
son para enfriar la unidad de disco. Todos los ventiladores se pueden intercambiar en
caliente. Si alguno de los ventiladores falla, el subsistema de supervisión detecta el
fallo y genera un mensaje de error en la consola del sistema, registra el mensaje en el
archivo /var/adm/messages e ilumina los indicadores de servicio solicitado.
El subsistema de alimentación se supervisa de manera similar. El subsistema de
supervisión indica el estado de las salidas CC, las entradas CA y la presencia de
cada una de las fuentes de alimentación analizando el estado de las fuentes de
alimentación periódicamente.
Nota – Los ventiladores de las fuentes de alimentación no se utilizan para enfriar el
sistema. Sin embargo, si falla alguna de las fuentes de alimentación, su ventilador
obtiene alimentación de las demás fuentes y de la placa base para mantener el
enfriamiento.
Si se detecta un problema en una fuente de alimentación, se envía un mensaje de error
a la consola del sistema y se registra en el archivo /var/adm/messages. También se
iluminan los indicadores situados en cada una de las fuentes de alimentación para
indicar la existencia de anomalías. Los indicadores de servicio solicitado del sistema se
iluminan para señalar un fallo del sistema. La consola del controlador del sistema
ALOM advierte de fallos en el registro de las fuentes de alimentación.
Recuperación automática del sistema
El sistema proporciona una recuperación automática del sistema (ASR) de fallos de
los componentes en los módulos de la memoria y en las tarjetas PCI.
Las características de recuperación automática del sistema (ARS) permiten que éste
pueda continuar en funcionamiento después de experimentar uno o varios errores
de hardware no graves. Las funciones de comprobación automática permiten al
Capítulo 5 Gestión de las funciones RAS y del firmware del sistema
97