¿Qué sucede cuando falla la llave USB o la tarjeta SD en la que instalé VMware ESXi?

29

Una tarjeta SD (SDHC) instalada en un servidor HP ProLiant DL380p Gen8 con VMware ESXi acaba de fallar :(

Encontré algunos mensajes ominosos en la consola vCenter y en el registro de eventos de HP ProLiant ILO ...

Perdió la conectividad con el dispositivo ... respaldando el sistema de archivos de arranque. Como resultado, los cambios de configuración del host no se guardarán en el almacenamiento persistente.

ingrese la descripción de la imagen aquí

Flash incorporado / TARJETA SD: Error al escribir el medio 0, bloque físico 848880: Excepción de pila.

ingrese la descripción de la imagen aquí


VMware recomienda el uso de dispositivos de arranque USB y SD (SDHC) para ESXi. Fue una de las principales razones por las que se desarrolló el tamaño más pequeño de ESXi (en comparación con el ESX anterior). He pasado mucho tiempo destacando las diferencias entre los modos instalable e integrado de ESXi para compañeros de trabajo y clientes. Sin embargo, estas fallas parecen suceder. En este caso, esta es mi tercera instancia.

Afortunadamente, este es un clúster de vSphere con almacenamiento SAN. ¿Qué pasos deben tomarse para remediar esta falla?

ewwhite
fuente

Respuestas:

29

Aquí está el proceso que usé para resolver esto:

VMware ESXi se puede instalar en modo incrustado o en modo instalable . Como se describe aquí , el modo de instalación está determinado por el medio de destino y el tamaño del volumen disponible para el instalador de ESXi.

  • USB, SDHC o cualquier dispositivo de menos de 5 GB de tamaño: integrado
  • Discos duros / volúmenes mayores o iguales a 5 GB de tamaño: instalable

Uno de los atributos únicos de ejecutar ESXi en modo incrustado es que el sistema operativo se carga en la RAM y solo toca el dispositivo USB / SD cada hora durante el funcionamiento normal. En mi situación, el sistema continuó funcionando, incluso con un dispositivo SDHC fallido.

El mensaje de error que recibí en la interfaz de vCenter indicaba que los cambios de configuración no se guardarían , pero el clúster todavía era utilizable. Dejé el sistema en este estado durante varios días hasta que pude llegar al centro de datos para reemplazar la tarjeta SD.


Con respecto a los pasos a seguir después de una falla de un dispositivo USB o SD, es importante extraer y guardar una copia de la configuración de su host.

Esto se logra fácilmente a través de PowerCLI o vSphere CLI . Usé PowerCLI ejecutándose desde el servidor vCenter:

Get-VMHostFirmware -VMHost 10.10.8.22 -BackupConfiguration -DestinationPath C:\Users\ewwhite\Downloads
  • Después de eso, evacué todas las máquinas virtuales del host afectado y lo puse en modo de mantenimiento.
  • Luego se cerró el host, se reemplazó la tarjeta SDHC con un nuevo dispositivo e instalé ESXi nuevamente.
  • Una vez que el host volvió a funcionar con una nueva instalación de ESXi, realicé los cambios mínimos de configuración necesarios para que el host fuera visible en la red; establecer información de IP, información de vlan y contraseña.
  • Recargué la configuración guardada en el host a través de PowerCLI ...

Para este paso, usé:

Set-VMHostFirmware -VMHost 10.10.8.22 -Restore -SourcePath c:\Users\ewwhite\configBundle-10.10.8.22.tgz -HostUser root -HostPassword YoMama!!

Restaurar la configuración obliga a reiniciar el host. Una vez más, pude emitir una reconexión para volver a unirme al host en vCenter y salir del modo de mantenimiento.


Si PowerCLI no está disponible, los comandos del shell ESXi se ven así:

vim-cmd hostsvc/firmware/backup_config 

Esto produce un enlace web que podrá navegar y descargar un tarball de la configuración del host.

Puede SCP un archivo de configuración a un host y utilizar lo siguiente para restaurar la configuración.

vim-cmd hostsvc/firmware/restore_config /tmp/configBundle.tgz

¡Eso es todo!

ewwhite
fuente
3
Si nunca antes ha usado PowerCLI, primero debe estar conectado a su clúster con algo como: C:\PS>Connect-VIServer -Server vcenter01 -User admin -Password pass blogs.vmware.com/PowerCLI/2013/03/…
Oscar
11

Artículo de KB: http://kb.vmware.com/selfservice/documentLinkInt.do?micrositeID=&popup=true&languageId=&externalID=2004784

Nota : En caso de que falle su tarjeta flash SD o unidad USB original, estos pasos se pueden utilizar en una capacidad de recuperación ante desastres para que un host ESXi completamente funcional se ejecute lo más rápido posible en una unidad USB o tarjeta flash SD de reemplazo.

Escenario de recuperación de desastres

Si tiene un almacén de datos local que contiene información de producción y ha completado la instalación en una unidad flash USB o tarjeta flash SD de reemplazo en un escenario de recuperación ante desastres, es posible que deba realizar estos pasos adicionales:

  1. Conéctese al host ESXi con vSphere Client o agregue el host ESXi a una implementación existente de vCenter Server.
  2. Haz clic en el host.
  3. Haga clic en la pestaña Configuración.
  4. Haz clic en Almacenamiento.
  5. Haga clic en Volver a analizar para asegurarse de que puede ver todos los almacenes de datos.
  6. Explore el almacén de datos y registre las máquinas virtuales que se encuentran en los almacenes de datos.
El limpiador
fuente
5

Yo diría que solo reinstale ESXi fresco en una nueva tarjeta, no vale la pena su tiempo o esfuerzo para tratar de preservar los datos potencialmente corruptos en la tarjeta actual.

Shane Madden
fuente
1

Uno de mis hosts mostró el mismo error "Conectividad perdida". Busqué en Google y encontré esta publicación. Así que intenté hacer una copia de seguridad de la configuración con PowerCLI y vCLI como se sugirió. La copia de seguridad volvió con "Error interno". Llamado VMWare. La respuesta es que cuando falla la tarjeta SD, no podrá hacer una copia de seguridad de su configuración porque el comando de copia de seguridad solo puede extraer la configuración de la tarjeta SD.

TCB admin
fuente
Esto es cierto si la tarjeta SD realmente falló, supongo. Puedo ejecutar los comandos de PowerCLI contra un host que muestra este error muy bien, así que no estoy seguro de por qué el "error interno" ocurre para usted.
TheCleaner