HP Smart Array; ¿Cómo eliminar de manera segura un disco físico con un fallo predictivo SMART de la matriz para que pueda ser reemplazado?

9

Ranura del controlador hpacucli = 1 ld 1 mostrar detalles

Smart Array P400 in Slot 1

   array A

      Logical Drive: 1
         Size: 273.3 GB
         Fault Tolerance: RAID 1+0
         Heads: 255
         Sectors Per Track: 32
         Cylinders: 65535
         Stripe Size: 128 KB
         Status: OK
         Array Accelerator: Enabled
         Unique Identifier: xxxx
         Disk Name: /dev/cciss/c0d0
         Mount Points: /boot 196 MB, / 7.8 GB
         Logical Drive Label: xxxxx
         Mirror Group 0:
            physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, Predictive Failure)
            physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
            physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
            physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
         Mirror Group 1:
            physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)
            physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
            physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
            physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)

Ranura del controlador hpacucli = 1 show

Smart Array P400 in Slot 1
   Bus Interface: PCI
   Slot: 1
   Serial Number: xxxx
   Cache Serial Number: xxxx
   RAID 6 (ADG) Status: Disabled
   Controller Status: OK
   Chassis Slot:
   Hardware Revision: Rev D
   Firmware Version: 4.06
   Rebuild Priority: Medium
   Expand Priority: Medium
   Surface Scan Delay: 15 secs
   Post Prompt Timeout: 0 secs
   Cache Board Present: True
   Cache Status: OK
   Accelerator Ratio: 100% Read / 0% Write
   Drive Write Cache: Disabled
   Total Cache Size: 256 MB
   Battery Pack Count: 0
   SATA NCQ Supported: True

¿Es seguro ejecutar esta secuencia de comandos?

hpacucli controller slot=1 array A remove drives=1:8
hpacucli controller slot=1 pd 1:8 modify led=on

obtenga manos remotas para quitar la unidad y reemplazarla. Entonces corre:

hpacucli controller slot=1 array A add drives=1:8

¿Obtendrá esto la matriz para reconstruir de forma segura?

gilesw
fuente

Respuestas:

7

Es seguro ejecutar esos comandos. El grupo espejo puede sobrevivir a la ausencia de un disco. Debería reconstruirse automáticamente, pero si no lo hace, el comando que ya identificó lo pondrá en marcha.

sysadmin1138
fuente
¿Se basa esto en la experiencia con los servidores HP? Estoy a favor de su solución simplemente porque si se está escribiendo un disco cuando se extrae físicamente de una matriz, los cabezales del disco estarán en el plato y podrían dañar el disco. Preferiría que el disco estuviera fuera de la matriz y girara hacia abajo. Que es de esperar lo que deberían hacer los comandos.
gilesw
2
@ Usuario70139 Las tarjetas SmartArray son lo suficientemente inteligentes como para dejar de escribir en un disco que está en pre-falla y comenzar a parpadear la luz de falla. I / O ya ha sido inmovilizado por la tarjeta. La unidad sigue girando, pero no se utilizan las cabezas. Si le preocupa, cuando extraiga el disco viejo, sáquelo una pulgada y espere 10 segundos antes de sacarlo por completo.
sysadmin1138
2
Siempre que sus discos HP tengan manijas rojas, son compatibles con el intercambio en caliente y se pueden extraer del servidor en cualquier momento, incluso cuando giran. Obviamente, no querrás agitarlo hasta que haya tenido 10-15 segundos para detener el giro de los platos. De hecho, simplemente no los agite nunca y debería estar bien. La reconstrucción / reemplazo de la unidad es responsabilidad del controlador y no debe preocuparse por ejecutar ningún comando antes o después de extraer una unidad fallida. Todo está sucediendo más abajo en la pila.
Chris Thorpe
10

Puede extraer el disco muerto y reemplazarlo; no es necesario involucrar al sistema operativo.

Chopper3
fuente
5

Una unidad con falla previa no necesariamente tendrá un indicador LED (a veces es un parpadeo ámbar lento), por lo que es una buena idea identificarlo para manos inteligentes. Sin embargo, no es necesario quitar la unidad de la matriz o volver a agregarla. Esas funciones serán manejadas por el controlador automáticamente. Todo lo que necesitarás es la hpacucli controller slot=1 pd 1:8 modify led=onlínea.

ewwhite
fuente
1

La secuencia de comandos que especifique no funciona en nuestros controladores Smart Array 641/642. Un This operation is not supported with the current configurationerror es el encuentro. En mi clase de matriz, estos comandos no funcionan, incluso si todos los discos funcionan correctamente. La mejor solución es el proceso de ewwhite para parpadear el disco y reemplazarlo físicamente.

SteveM
fuente