VMAX All Flash con HYPERMAX OS
Comprobaciones de integridad de los datos
HYPERMAX OS valida la integridad de los datos en cada punto posible del ciclo de vida de los
datos. Desde el momento en que los datos ingresan en un arreglo, se protegen continuamente por
medio de metadatos de detección de errores. Los mecanismos de hardware y software revisan
estos metadatos siempre que se transfieran datos dentro del arreglo. Esto permite al arreglo
proporcionar una verdadera revisión de integridad de punto a punto y protección contra fallas de
hardware o software.
Los metadatos de protección se anexan al flujo de datos y contienen información que describe la
ubicación esperada de los datos y una representación de CRC del contenido real de los datos. Los
valores esperados que se encuentran en los metadatos de protección se almacenan de manera
persistente en un área separada del flujo de datos. Los metadatos de protección se utilizan para
validar la exactitud lógica de los datos que se transfieren dentro del arreglo cada vez que los datos
se mueven entre chips de protocolo, búferes internos, terminales de fabric de datos internos, la
caché del sistema y unidades del sistema.
Monitoreo y corrección de unidades
HYPERMAX OS realiza un monitoreo en busca de fallas de mediana gravedad mediante el análisis
del resultado de cada transferencia de datos de disco y mediante el escaneo proactivo de todo el
disco durante el tiempo de inactividad. Si se determina que un bloque del disco es defectuoso, el
director:
1. Reconstruye los datos en el almacenamiento físico si es necesario.
2. Vuelve a escribir los datos en el almacenamiento físico si es necesario.
El director rastrea cada bloque fallido detectado en una unidad. Si la cantidad de bloques fallidos
supera un umbral predefinido, el arreglo invoca una operación de repuesto para reemplazar la
unidad fallida y envía una alerta al Servicio al cliente para gestionar la medida correctiva, si es
necesario. Con el modelo de servicio diferido, a menudo no se requiere una acción inmediata.
Verificación de errores y corrección de errores en la memoria física
HYPERMAX OS corrige los errores de un bit e informa un código de error una vez que los errores
de un bit alcanzan un umbral predefinido. En el improbable caso de que sea necesario reemplazar la
memoria física, el arreglo notifica al Servicio al cliente y se pide el reemplazo.
Reemplazo de unidades y repuestos de miembros directos
Cuando HYPERMAX OS 5977 detecta que una unidad va a fallar o ha fallado, se inicia un proceso
de reemplazo con repuestos de miembros directos (DMS). El repuesto de miembro directo busca
dentro del mismo motor repuestos disponibles que sean del mismo tamaño de bloque, capacidad y
velocidad, con el mejor repuesto disponible siempre utilizado.
Con el reemplazo con repuestos de miembros directos, el repuesto invocado se agrega como otro
miembro del grupo RAID. Durante la reconstrucción de una unidad, se admite la opción para copiar
los datos directamente de la unidad dañada en la unidad de repuesto disponible. La unidad
defectuosa se quita únicamente una vez que finaliza el proceso de copia. El reemplazo con
repuestos de miembros directos se inicia de manera automática tras la detección de condiciones de
error en la unidad.
El reemplazo con repuestos de miembros directos ofrece las siguientes ventajas:
l
Guía del producto Dell EMC VMAX All Flash VMAX 250F, 450F, 850F y 950F con HYPERMAX OS
38
El arreglo puede copiar los datos desde el miembro RAID con errores (si está disponible), lo que
elimina la necesidad de leer los datos desde todos los miembros y generar la reconstrucción. La
operación de copia en el nuevo miembro de RAID utiliza menos recursos del CPU.