A pesar de investigar este tema bastante en línea (para ser justos, no soy un administrador de sistemas a tiempo completo) no puedo resolverlo.
Tenemos un montón de servidores VMWare ESXi 5.5, algunos de los cuales están integrados en vSphere, otros no (por razones de costo).
Todos ellos ejecutan la imagen ESXi estándar, con la excepción de una máquina que realmente ejecuta la imagen DELX VMWare ESXi.
Lo que me gustaría lograr parece simple: configurar el sistema para que se pueda consultar a través de SNMP desde un host remoto, ya sea snmpwalk, Nagios, PRTG, etc. Me gustaría ver información de sensores de temperatura, discos instalados y su estado. , velocidad del ventilador, estado de la fuente de alimentación, etc.
Tenía la impresión de que instalar la versión VMWare de DELL habilitaría automáticamente los módulos necesarios (OpenManage lo más importante), pero parece que ese no es el caso.
Tengo información contradictoria sobre si esto es posible, algunos documentos dicen que no puede consultar un servidor DELL VMWare ESXi a través de SNMP y que necesita usar un cliente CIM. Luego están los VIB de OMSA que se pueden instalar, etc.
Me imagino que este es un requisito bastante común, sin embargo, los documentos disponibles tiran de uno en todas las direcciones diferentes.
¿Es posible lo que estoy tratando de hacer (sin un entorno vSphere completo)?
fuente
Respuestas:
Sí, puede monitorear el host ESXi independiente usando cualquier software de monitoreo SNMP, pero algunos elementos solo pueden verse con una herramienta de monitoreo que admita el protocolo CIM.
Todos mis hosts ESXi son parte de vCenter pero los monitoreamos directamente (usando la dirección IP del host vmkernal) con SolarWinds NPM. Hay 5 o 6 módulos CIM integrados en ESXi 5.5 que le brindan el estado del hardware, pero el estado de la tarjeta RAID no es uno de ellos. Deberá agregar el Dell OMSA VIB que agrega los agentes CIM adicionales, incluido el de la matriz RAID. La publicación de Brian Atkinson sigue siendo la mejor que he encontrado que describe el proceso,
https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi
Solo necesita seguir las instrucciones para instalar OMSA ESXi VIB si va a utilizar una herramienta de monitoreo de terceros que proporciona información histórica y alerta. Si desea utilizar el servidor Dell OMSA, puede instalarlo de forma remota en un servidor básico, de forma remota en una VM o localmente como una VM.
Puede utilizar el servidor OMSA para conectarse a las tarjetas de administración DRAC e iDRAC fuera de banda (OOB / IPMI / iLo) o al host ESXi después de instalar el VIB OMSA en el host ESXi. Sin embargo, no verá la información de estado de RAID en el DRAC o el iDRAC, solo cuando conecte el servidor OMSA a un host ESXi. Repito la palabra clave del servidor para que no haya confusión entre el servidor que actúa como cliente para el VIB de OMSA que está instalado en el host ESXi.
Algunos recursos útiles:
Mostrar los proveedores de CIM actuales en un host ESXi https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715
Muestre los VIB instalados actualmente en el host ESXi desde la CLI del host,
esxcli software vib list
Verá algunos detalles menores del estado del hardware adicional cuando se conecte a un servidor vCenter en comparación con el host ESXi directamente, pero en general si no ve el estado del hardware que está buscando en el panel Estado de configuración / estado, le falta un proveedor de CIM y debe ubicar e instalar el VIB en el host ESXi. Cuando agrega Dell OMSA VIB al host ESXi, verá un sensor de almacenamiento agregado a la página de estado de salud que muestra los volúmenes RAID, las unidades, el controlador y el estado de la batería de su controlador de almacenamiento. Es posible que deba restablecer los sensores para que se muestren y, a veces, tarda entre 15 y 20 minutos la primera vez después de la instalación y reinicio de VIB del host ESXi.
Si no ve un sensor en la página de estado de salud del host ESXi cuando se conecta con vSphere Client, lo más probable es que no lo vea cuando esté sondeando los sensores de forma remota con un software de monitoreo.
También debe tener en cuenta que no todos los servidores tienen los mismos sensores y es posible que no pueda obtener el mismo estado de salud de todos, dependiendo del hardware del servidor, la tarjeta RAID y la versión del CIM disponibles para la combinación. También es posible que deba actualizar o cambiar los VIB de la tarjeta RAID para que funcione el estado de salud. El proveedor de CIM (que es el OMSA VIB en este caso) se comunica con el hardware a través del dispositivo VIB (el controlador real del dispositivo) y pasa esta información al agente de CIM en el host ESXi, también conocido como Small Footprint CIM Broker Daemon ( sfcbd). Cuando sondea el host ESXi para conocer el estado del hardware utilizando un software de monitoreo robusto, obtendrá cierta información mediante consultas SNMP, algunas utilizando CIM y otras utilizando la API ESXi (que son solicitudes SOAP). El cliente CIM habla con el proceso sfcbd en el host ESXi.
A veces, el proceso CIM simplemente deja de funcionar. Cuando eso suceda, reiniciará el proceso sfcbd-watchdog en el host ESXi. Esto reiniciará el servicio sfcbd y el sondeo CIM funcionará nuevamente. Desde la CLI del host,
/etc/init.d/sfcbd-watchdog restart
Creo que eso cubre la mayoría de los elementos que necesitas para que puedas correr.
fuente
Entiendo lo que estás buscando; notas específicas sobre cómo administrar y monitorear el estado de un host VMware ESXi independiente.
En la práctica, el enfoque debería ser ligeramente diferente. Explicaré cómo administro los hosts.
En una situación en la que tiene varios hosts ESXi bajo la administración de vCenter, se supone que aprovecha vCenter para el monitoreo y el estado de salud , en lugar de consultar los hosts individuales. Hay una alarma general que configuro en vCenter para alertar sobre "Host Hardware Health". Por lo general, no me importa si es una fuente de alimentación, RAM, disco o cualquier otro componente, sino que el host no es saludable.
La supervisión de un host ESXi independiente no será muy útil, ya que el objetivo de los controladores Dell / HP es exponer información a vCenter. Y no creo que sea la mejor práctica consultar hosts individuales de esta manera. De acuerdo, eso se debe a que lo ideal es que sus hosts VM se administren de forma centralizada.
Si ejecuta vCenter con un solo host, SÍ obtiene esta capacidad, por lo que tal vez esa sea una opción para su entorno.
Si necesita algún tipo de monitoreo fuera de banda, ¿no podría consultar el DRAC?
fuente
puede usar el excelente https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environments/VMWare/check_vmware_api/details (con o sin nagios), aprovecha la vmware api para obtener todos los información que necesita para el monitoreo de hardware:
Necesita el sdk perl vmware, pero aparte de eso, es bastante sencillo. Funciona para todos los tipos de hardware (siempre que los sensores sean vistos por la API de vmware, estarán marcados).
fuente
Prueba zabbix ( http://zabbix.com ):
1) es un software de monitoreo de clase mundial perfecto y conocido
2) puede comenzar fácilmente con el dispositivo Zabbix disponible también como imagen virtual preconfigurada (basada en OpenSuSE).
3) puede monitorear hosts y máquinas ESX [I] utilizando servicios web de Vmware (como cliente web). Puede usar reglas de descubrimiento de bajo nivel para descubrir automáticamente hipervisores VMware y máquinas virtuales y crear hosts para monitorearlos, según prototipos de host predefinidos.
4) podrá monitorear todo el hardware de sus servidores Dell utilizando SNMP a través de iDrac, incluido el controlador RAID y su estado de volúmenes, discos físicos / módulos de memoria / PSU, etc.
Se puede acceder a todo tipo de información de estado de hardware [como está disponible en iDrac] a través de SNMP (al menos en servidores con IDrac 7/8 - He implementado la supervisión del hardware de más de 50 servidores Dell 12/13 de generación para mi compañía en este camino).
Con la característica perfecta de LLD (descubrimiento de bajo nivel) de zabbix, puede recopilar fácilmente todos los componentes de hardware para el monitoreo sin enumeración manual y crear automáticamente elementos para el monitoreo (estados, temperaturas, velocidades de los ventiladores, tamaños de discos y series, etc.), disparadores (expresiones para procesar datos de monitoreo) y varias acciones ...
fuente