Monitoreo de disco / RAID para servidores HP Proliant y Ubuntu 12.04

10

¿Cómo puedo monitorear el estado de los discos duros y los RAID de un servidor HP Proliant con Ubuntu 12.04? En Ubuntu 10.04 podría usar cciss-vol-status para consultar el estado RAID periódicamente, pero cciss-vol0-status ya no funciona en 12.04. En 12.04 no hay directorios / proc / driver / cciss o / dev / cciss.

Dibujó
fuente
Tengo una instalación estándar de Ubuntu 12.04 en un Proliant DL185 G4 y tiene / dev / cciss y / proc / driver / cciss. ¿Qué dice lspci que tienes para un controlador RAID?
cuello largo

Respuestas:

10

Grrr ... Ubuntu. :)

¿Qué tipo de servidor HP ProLiant es este? (modelo y generación, por favor)

Su dispositivo de accionamiento variará dependiendo de su controlador Smart Array. Con el cambio de los servidores G5 a G6, el controlador del controlador RAID HP cambió del controlador CCISS heredado al nuevo controlador HPSA . Con el controlador más nuevo, no verá el controlador de bloque CCISS ... Los dispositivos sí /dev/sdX.

De todos modos, su clave para monitorear los controladores Smart Array RAID es instalar los Agentes de administración de HP. Como mínimo, querrás la hpacucliutilidad de línea de comandos. Ubuntu y Debian siempre han tenido menos soporte oficial de HP que Red Hat / SuSE. Sin embargo, hay un paquete de soporte de Debian ProLiant que incluye agentes y herramientas para sistemas Ubuntu / dpkg.

Es un enfoque más integral que puede generar trampas SNMP y alertas de correo electrónico ingeniosas. Con el fin de simplemente obtener el software de configuración y administración de RAID, tire de la hpacucliutilidad desde el repositorio de HP .

Es posible que también deba apt-get install lib32gcc1 lib32stdc++6 libc6-i386cumplir los requisitos previos de 32 bits.

Desde allí, puede usar algunos hpacuclicomandos comunes para obtener el estado RAID. Un ejemplo sencillo:

[root@Woot ~]# hpacucli ctrl all show config       

Smart Array P410i in Slot 0 (Embedded)    (sn: 500143801664FE50)

   array A (SAS, Unused Space: 0  MB)


      logicaldrive 1 (279.4 GB, RAID 1, OK)

      physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK)
      physicaldrive 2I:1:5 (port 2I:box 1:bay 5, SAS, 300 GB, OK)

   array B (Solid State SATA, Unused Space: 0  MB)


      logicaldrive 2 (447.1 GB, RAID 1+0, OK)

      physicaldrive 1I:1:3 (port 1I:box 1:bay 3, Solid State SATA, 240.0 GB, OK)
      physicaldrive 1I:1:4 (port 1I:box 1:bay 4, Solid State SATA, 240.0 GB, OK)
      physicaldrive 2I:1:7 (port 2I:box 1:bay 7, Solid State SATA, 240.0 GB, OK)
      physicaldrive 2I:1:8 (port 2I:box 1:bay 8, Solid State SATA, 240.0 GB, OK)

   SEP (Vendor ID PMCSIERA, Model  SRC 8x6G) 250 (WWID: 500143801664FE5F)
ewwhite
fuente
Gracias Edmund El servidor es HP Proliant DL360 G7 y tiene razón, los dispositivos RAID están en / dev / sdX.
Dibujó el
2
Solo otra nota, parece que cambiaron el nombre de Proliant Support Pack a Management Component Pack para 12.04. communitylinux.org/node/446#comment-866
Drew
3

Los pasos a continuación son los que hice para que funcione para Ubuntu 16.04.

echo 'deb http://downloads.linux.hpe.com/SDR/repo/mcp xenial/current non-free' > /etc/apt/sources.list.d/hp.list
apt-get update
apt-get install hpacucli hp-health hponcfg hp-ams hp-snmp-agents hpmh hpsmh hpssaducli hpssa
usuario410516
fuente
2

También puede usar repos como está escrito aquí: http://sysadmin.te.ua/linux/hpraid-monitoring.html

echo 'deb http://hwraid.le-vert.net/ubuntu precise main' > /etc/apt/sources.list.d/raid.list

¡Este repositorio tiene casi todas las utilidades de monitoreo de incursiones para todo tipo de incursiones! Saludos.

Aleksandr
fuente
1

Parece que las cosas han cambiado ligeramente. La respuesta del usuario410516 está aproximadamente en el objetivo, aunque algo breve.

Los repositorios de Hewlett Packard Enterprise ahora se gestionan aquí . Para Ubuntu 16.04 descubrí que necesitaba el " Paquete de componentes de gestión para ProLiant", que se describe como "Software de agente para Ubuntu, Oracle y distribuciones de la comunidad". HPE proporciona el script add_repo.sh para agregar sus repositorios a su instalación.

$ ./add_repo.sh mcp
note : You must read and accept the License Agreement to continue.
Press enter to display it ...


 END USER LICENSE AGREEMENT
...

Este script no registró las claves de HPE, por lo tanto, siguiendo estas instrucciones:

curl http://downloads.linux.hpe.com/SDR/hpPublicKey1024.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpPublicKey2048.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpPublicKey2048_key1.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpePublicKey2048_key1.pub | apt-key add -

Ejecutando apt updatelos siguientes paquetes nuevos estarán disponibles.

  • cpqacuxe
  • hp-ams
  • HP-salud
  • hp-smh-templates
  • hp-snmp-agents
  • hpacucli
  • hponcfg
  • hpsmh
  • hpssa
  • hpssacli
  • hpssaducli

Y nosotros podemos apt install hpssa hpacucli hpssacli hpssaducli.

$ hpacucli ctrl all show config

Smart Array P400 in Slot 0 (Embedded)     (sn: XXXXXXXXXXXXXX)

   array A (SAS, Unused Space: 0  MB)


      logicaldrive 1 (956.9 GB, RAID 5, Interim Recovery Mode)

      physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 146 GB, OK)
      physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 146 GB, OK)
      physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 146 GB, Failed)
      physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 146 GB, OK)
      physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 146 GB, OK)
      physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 146 GB, OK)
      physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 146 GB, OK)
      physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 146 GB, OK)


Smart Array P400 in Slot 1                (sn: XXXXXXXXXXXXXX)

   array A (SAS, Unused Space: 0  MB)


      logicaldrive 1 (136.7 GB, RAID 1+0, OK)

      physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
      physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
      physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 300 GB, OK)
      physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 300 GB, OK)

Podemos ver que hay una unidad fallida allí y podemos obtener los detalles para el reemplazo con:

$ hpacucli ctrl slot=0 pd 1I:1:15 show detail

Smart Array P400 in Slot 0 (Embedded)

   array A

      physicaldrive 1I:1:15
         Port: 1I
         Box: 1
         Bay: 15
         Status: Failed
         Last Failure Reason: Hardware error
         Drive Type: Data Drive
         Interface Type: SAS
         Size: 146 GB
         Rotational Speed: 10000
         Firmware Revision: HPDC
         Serial Number: XXXXXXXXXXXXXXXXXXXX
         Model: HP      XXXXXXXXXX
         PHY Count: 2
         PHY Transfer Rate: 3.0Gbps, Unknown
Samuel Harmer
fuente