Ejecución de pasos básicos
Puede utilizar cualquiera de las opciones disponibles descritas en las secciones anteriores para realizar los pasos básicos de la metodología
de aislamiento de fallas.
Recopile información de fallas
Cuando se produce una falla, recopile toda la información posible. Esto lo ayudará a determinar la acción correcta necesaria para resolver la
falla.
Empiece por revisar la falla informada:
•
La falla, ¿está relacionada con una ruta de datos interna o una ruta de datos externa?
•
La falla, ¿está relacionada con un componente de hardware, como módulo de unidad de disco, módulo de controladora o unidad de
suministro de energía?
Al aislar la falla a uno de los componentes dentro del sistema de almacenamiento, podrá determinar la acción correctiva necesaria más
rápidamente.
Determine dónde está ocurriendo la falla
Cuando se produce una falla, el LED de falla del módulo se ilumina. Verifique los LED en la parte posterior del gabinete para limitar la falla a
una CRU, una conexión o ambas. Los LED también ayudarán a identificar la ubicación de una CRU que informa una falla.
Utilice el PowerVault Manager para verificar cualquier falla encontrada gracias a los LED. Use el PowerVault Manager para determinar
dónde ocurre la falla si los LED no se pueden ver debido a la ubicación del sistema. Esta aplicación web proporciona una representación
visual del sistema y de dónde ocurre la falla. El PowerVault Manager también proporciona información más detallada sobre las CRU, los
datos y las fallas.
Revise los registros de eventos
Los registros de eventos registran todos los eventos del sistema. Cada evento tiene un código numérico que identifica el tipo de evento
producido y tiene uno de los siguientes niveles de gravedad:
•
Crítica: se produjo una falla que podría provocar que una controladora se apague. Corrija el problema inmediatamente.
•
Error: se produjo una falla que puede afectar a integridad de los datos o la estabilidad del sistema. Corrija el problema lo antes posible.
•
Advertencia: se produjo un problema que puede afectar la estabilidad del sistema, pero no la integridad de los datos. Evalúe el problema
y corríjalo si es necesario.
•
Informativa: se produjo un cambio de estado o configuración, o se produjo un problema que el sistema corrigió. No se requiere una
acción inmediata.
Los registros de eventos registran todos los eventos del sistema. Revise los registros para identificar la falla y el motivo de la falla. Por
ejemplo, un host podría perder la conectividad a un grupo de discos si el usuario cambia la configuración de canal sin tener en cuenta los
recursos de almacenamiento asignados. Además, el tipo de falla puede ayudarlo a aislar el problema al hardware o el software.
Aísle la falla
Ocasionalmente, puede que sea necesario aislar una falla. Esto es cierto con rutas de datos, debido a la cantidad de componentes que las
componen. Por ejemplo, si se produce un error de datos del lado del host, podría ser provocado por cualquier componente de la ruta de
datos: el módulo de controladora, el cable o el host de datos.
Si el gabinete no se inicializa
Los gabinetes pueden demorar hasta dos minutos en iniciarse.
Si el gabinete no se inicia, realice lo siguiente:
•
Realice una reexaminación
•
Realizar un ciclo de encendido del sistema
•
Asegúrese de que el cable de alimentación esté conectado correctamente y verifique la fuente de alimentación a la que está conectado
•
Verifique el registro de eventos en busca de errores
86
Solución de problemas