HP SmartArray P400: ¿Cómo reparar la unidad lógica fallida?

8

Tengo un servidor HP con controlador SmartArray P400 (incluido 256 MB de caché / respaldo de batería) con una unidad lógica con unidad física defectuosa reemplazada que no se reconstruye.

Así es como se veía cuando detecté el error:

~ # / usr / sbin / hpacucli ctrl slot = 0 show config
Smart Array P400 en la ranura 0 (integrada) (sn: XXXX)

  matriz A (SATA, espacio no utilizado: 0 MB)
    Logicaldrive 1 (698.6 GB, RAID 1, OK)
      physicaldrive 1I: 1: 1 (puerto 1I: casilla 1: bahía 1, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 2 (puerto 1I: casilla 1: bahía 2, SATA, 750 GB, OK)

  matriz B (SATA, espacio no utilizado: 0 MB)
    Logicaldrive 2 (2.7 TB, RAID 5, Fallido)
      physicaldrive 1I: 1: 3 (puerto 1I: casilla 1: bahía 3, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 4 (puerto 1I: casilla 1: bahía 4, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 5 (puerto 2I: casilla 1: bahía 5, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 6 (puerto 2I: casilla 1: bahía 6, SATA, 750 GB, Fallido)
      physicaldrive 2I: 1: 7 (puerto 2I: casilla 1: bahía 7, SATA, 750 GB, OK)

  no asignado
      physicaldrive 2I: 1: 8 (puerto 2I: casilla 1: bahía 8, SATA, 750 GB, OK)
~ # 

Pensé que tenía la unidad 2I: 1: 8 configurada como repuesto para la matriz A y la matriz B, pero parece que este no fue el caso :-(. Noté el problema debido a errores de E / S en el host, incluso si solo falla 1 unidad física del RAID5.

¿Alguien sabe por qué esto podría suceder? ¿El logicaldrive debe entrar en modo "Degradado" pero aún así ser completamente accesible desde el sistema operativo host?

Primero intenté agregar la unidad no asignada 2I: 1: 8 como repuesto para logicaldrive 2, pero esto no fue posible:

~ # / usr / sbin / hpacucli ctrl slot = 0 array B agregar repuestos = 2I: 1: 8
    Error: esta operación no es compatible con la configuración actual.
    Use el comando "show" en dispositivos para mostrar detalles adicionales 
    Sobre la configuración.
~ #  

Curiosamente, es posible agregar la unidad no asignada a la primera matriz sin problemas. Pensé que tal vez el controlador puso la matriz en estado "fallido" debido a la falta de repuesto y protege las matrices fallidas de modificaciones. Así que traté de volver a habilitar Logicaldrive (para agregar el repuesto después):

~ # / usr / sbin / hpacucli ctrl slot = 0 ld 2 modificar reenable
    Advertencia: es posible que los datos existentes anteriormente en la unidad lógica no 
    ser válido o recuperable ¿Seguir? (y / n) y

    Error: esta operación no es compatible con la configuración actual.
    Use el comando "show" en dispositivos para mostrar detalles adicionales
    Sobre la configuración.
~ # 

Pero como puede ver, volver a habilitar Logiveldrive no fue posible.

Ahora reemplacé la unidad fallida al cambiarla por la unidad no asignada. El estado ahora se ve así:

~ # / usr / sbin / hpacucli ctrl slot = 0 show config
Smart Array P400 en la ranura 0 (integrada) (sn: XXXX)

  matriz A (SATA, espacio no utilizado: 0 MB)
    Logicaldrive 1 (698.6 GB, RAID 1, OK)
      physicaldrive 1I: 1: 1 (puerto 1I: casilla 1: bahía 1, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 2 (puerto 1I: casilla 1: bahía 2, SATA, 750 GB, OK)

  matriz B (SATA, espacio no utilizado: 0 MB)
    Logicaldrive 2 (2.7 TB, RAID 5, Fallido)
      physicaldrive 1I: 1: 3 (puerto 1I: casilla 1: bahía 3, SATA, 750 GB, OK)
      physicaldrive 1I: 1: 4 (puerto 1I: casilla 1: bahía 4, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 5 (puerto 2I: casilla 1: bahía 5, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 6 (puerto 2I: casilla 1: bahía 6, SATA, 750 GB, OK)
      physicaldrive 2I: 1: 7 (puerto 2I: casilla 1: bahía 7, SATA, 750 GB, OK)
~ # 

La unidad lógica todavía no es accesible. ¿Por qué no está reconstruyendo?

¿Que puedo hacer?

FYI, esta es la configuración de mi controlador:

~ # / usr / sbin / hpacucli ctrl slot = 0 mostrar
 Smart Array P400 en la ranura 0 (integrado)
  Interfaz de bus: PCI
  Ranura: 0
  Número de serie: XXXX
  Número de serie de caché: XXXX
  Estado RAID 6 (ADG): habilitado
  Estado del controlador: OK
  Ranura del chasis:
  Revisión de hardware: Rev E
  Versión de firmware: 5.22
  Prioridad de reconstrucción: media
  Expandir Prioridad: Media
  Retraso de escaneo de superficie: 15 segundos
  Notificación de inconsistencia de análisis de superficie: deshabilitado
  Almacenamiento intermedio de escritura de Raid1: deshabilitado
  Tiempo de espera posterior a la solicitud: 0 segundos
  Tablero de caché presente: verdadero
  Estado de caché: OK
  Relación del acelerador: 25% de lectura / 75% de escritura
  Caché de escritura de unidad: deshabilitado
  Tamaño total de caché: 256 MB
  Caché de escritura sin batería: deshabilitado
  Fuente de alimentación de respaldo de caché: baterías
  Recuento de batería / condensador: 1
  Estado de la batería / condensador: OK
  SATA NCQ compatible: verdadero
~ # 

Gracias por su ayuda de antemano.

TegtmeierDE
fuente

Respuestas:

5

La respuesta no es agradable. Existe una alta probabilidad de que su matriz esté en un estado de "espera de reconstrucción", donde hay otro disco defectuoso en el conjunto de la matriz RAID5 que impide que se complete la recuperación. Es por eso que debe evitar RAID5 en estos días . No ayuda que se trate de unidades SATA ... La probabilidad de problemas es aún mayor. Intente apagar el sistema (dejar que las unidades giren hacia abajo) y volver a encenderlo. Siga las instrucciones en la pantalla de la matriz del BIOS y elija la F2opción para "volver a habilitar todas las unidades lógicas". Esto puede iniciar el proceso de reconstrucción.

De lo contrario, es una reconstrucción / recuperación con nuevos discos.

ewwhite
fuente
0

Debe iniciar en ACU y ver qué está sucediendo exactamente. Si no se puede acceder a toda la unidad lógica, puede volver a habilitarla allí.

Kly
fuente