Opciones de almacenamiento compartido para el clúster ESXi HA

8

Estoy buscando recomendaciones de opciones de almacenamiento compartido para admitir el clúster ESXi HA (tenga en cuenta que NO estoy pidiendo recomendaciones de producto / marca / modelo; sé que esto va en contra de las reglas aquí). Estoy pidiendo a la tecnología de recomendación.

La empresa para la que trabajo es una pequeña empresa. Por el momento, tenemos un HP DL380 G9 con DAS, con ESXi 6.0, que ejecuta nuestra aplicación desarrollada a medida. Ahora estamos viendo cómo lograr HA / FT utilizando la opción más económica. Necesitamos HA / FT porque soy el equipo de TI de un solo hombre y a menudo viajo lejos, por lo que la conmutación por error / restauración manual no es una opción.

Entiendo que necesitamos un mínimo de 2 hosts ESXi (servidor físico) y almacenamiento compartido para lograr HA / FT. Esto es, creo, donde se pone interesante: incluso la matriz de almacenamiento de nivel de entrada más barata que existe es probablemente una exageración para nosotros. Nuestro requisito de capacidad de almacenamiento es probablemente de alrededor de 200 GB, y no vemos que se duplique durante al menos 5 años. Sin embargo, necesitamos el almacenamiento compartido para HA / FT.

Por lo tanto, realmente agradecería cualquier recomendación sobre mis opciones. Gracias.

Arturo
fuente
¿Qué tal un NAS basado en NFS? Pueden ser muy baratos, pero una vez más, uno barato será un punto único de falla más grande que su configuración actual. En realidad, desea dos unidades de suministro de energía y controladores, y esos no son baratos. Algo así como un HPE MSA sería bueno, pero nuevamente no gratis. Donde estas en el mundo Estoy en el Reino Unido, quizás podríamos hablar sobre esto. Ah, y sabes que FT es MUY 'pesado' en la red, ¿verdad?
Chopper3
Hubiera respondido si esta pregunta no estuviera cerrada.
ewwhite
@ Chopper3 He considerado ejecutar NFS en nuestro NAS QNAP, pero creo que el modelo que tenemos probablemente no será lo suficientemente rápido para la conmutación por error. He examinado HPE, pero incluso el modelo de entrada es bastante caro y creo que tendríamos dificultades después de gastar una gran parte de nuestro presupuesto en las licencias de vSphere. Por desgracia, estoy en Taiwán, de lo contrario me hubiera encantado chatear en persona.
Arthur
@ewwhite, he reeditado mi pregunta (cometí un error tipográfico), pero no estoy seguro de si EEAA va a volver a abrirla ... ¿quizás usar el comentario para responder? Gracias.
Arthur
¿Dónde estás ubicado y qué tan bueno eres con Linux?
ewwhite

Respuestas:

10

Notas generales (flujo de conciencia):

  • Piensa mucho en lo que estás tratando de proteger.
  • Nadie usa VMware Fault-Tolerance. De acuerdo, tal vez alguien lo haga, pero hay demasiadas restricciones, y el caso de uso es particularmente estrecho.
  • Los servidores son más confiables de lo que espera, especialmente cuando trabaja con sistemas de calidad como HP ProLiant. Supermicro sería otra historia ...
  • Evaluar modos de falla realistas. Un servidor HP ProLiant Gen9 no solo va a fallar .
  • Puede encontrar fallas de componentes individuales, pero hay suficientes redundancias internas para manejar la mayoría de los problemas con gracia.
    • En serio, las fuentes de alimentación redundantes, los ventiladores redundantes, RAID de discos internos, los adaptadores NIC y FLR integrados rara vez fallan.
    • Agregue monitoreo de la OIT, verificaciones integrales del estado del hardware y la gama de elementos que afectan el tiempo de actividad se reduce a fallas DIMM y problemas de la placa del sistema.

Así que ahora llegamos al almacenamiento compartido. El almacenamiento compartido se convierte en un punto de falla, dependiendo de cómo esté diseñado.

  • Algo parecido a una matriz MSA SAS-adjunta es una opción y puede funcionar con VMware y dos hosts. Puede comprarlos desnudos y agregar la capacidad requerida.
  • Una configuración de nada compartido sería beneficiosa en algunos aspectos, pero agrega ciertas complejidades.
  • Hay opciones hiperconvergentes como VMware vSAN , HPE StoreVirtual VSA o la oferta de Virtual SAN de Starwind .
  • El HPE VSA puede ser gratuito para hasta 1 TB de almacenamiento para su configuración.
  • Una SAN de nivel de entrada no es tan atractiva teniendo en cuenta que sus requisitos de espacio son increíblemente bajos.
  • Es posible ir con almacenamiento de una sola cabeza ... posiblemente incluso un servidor HP normal con un sistema operativo de almacenamiento de su elección (Linux exportando NFS, Windows Storage Server, etc.)
  • He documentado y esbozado una solución ZFS para Linux que puede proporcionar conmutación por error de doble cabeza y agrupamiento para almacenamiento: consulte: https://github.com/ewwhite/zfs-ha
  • Otra solución que no puede hacer nada compartido con un par de servidores es Zetavault .
  • Combine eso con la replicación a nivel de máquina virtual de Veeam o algo basado en una matriz, y ha cubierto el 99% de los posibles problemas de almacenamiento.

Pero, de nuevo, esta es una función de su riesgo. La gente puede bajar fácilmente por la madriguera del conejo de alta disponibilidad ...

Hipervisores duales anfitriones ... está bien. Entonces, ¿necesita telas de doble conmutación? Interruptores apilados? ¿Agregación de enlaces de chasis múltiple (MLAG / MC-LAG)? ¿Una SAN con controladores dobles? ¿Dos SAN? Replicación de SAN? Replicación VM? Replicación de VM a almacenamiento diverso?

¿Tienes diversidad de poder? Múltiples PDU? Múltiples unidades UPS? ¿El sitio está respaldado por un generador?

Entonces, ¿qué te queda?

Creo que es mejor tener algunas opciones. Tal vez contratar ayuda adicional para la cobertura. Documente la solución lo suficientemente bien como para que el cliente tenga algunas opciones. Haga un DR / interrupción del sistema runbook / script.

ewwhite
fuente
gracias por la respuesta muy detallada! Me ha proporcionado una perspectiva interesante sobre "no ser tan paranoico" sobre la fiabilidad de los servidores. Veo lo que quiere decir acerca de dibujar la línea en la que HA se detiene, tenemos múltiples PDU que funcionan con dos UPS y disyuntores diferentes, pero eso es todo (sin STS, etc.). Dicho esto, definitivamente necesitaremos dos hosts de hipervisor, por lo que ahora nos centraremos en las opciones de almacenamiento compartido sugeridas. El HPE VSA se ve bastante atractivo y la gran solución de ZFS (pero en realidad mi habilidad de administrador de sistemas de Linux parece estar a la altura). Gracias una vez más, muy apreciado!
Arthur
Y con respecto al presupuesto, esperábamos eliminar el almacenamiento compartido + un nuevo DL380 G9 en US $ 10k. La razón para hacer esta pregunta en primer lugar es porque sabemos que eso no se puede lograr si optamos por HP MSA o matrices de almacenamiento comercial similares.
Arthur
Dado que sus necesidades de capacidad de almacenamiento son bajas, un HP P2000 G3 usado o antiguo con 4 o 6 discos SAS funcionaría de manera predecible y podría costar menos de $ 4k. Pero el enfoque VSA es casi gratuito, pero necesitaría un tercer host. O simplemente usar otro servidor como almacenamiento puede ser lo suficientemente razonable. Muchas opciones
ewwhite
1
Ciertamente miraría Starwind VSA entonces. No es necesario un tercer nodo, soporte de escenario activo-activo y, como resultado, un buen rendimiento.
batistuta09
5

Si su empresa no puede soportar el tiempo de inactividad de los usuarios, entonces VMware FT es su elección. Para implementar esta función, definitivamente necesitará algún tipo de almacenamiento compartido. Para el caso, recomendaría buscar soluciones de almacenamiento definido por software (SDS) que se utilizan cada vez más para construir infraestructuras virtualizadas. Con este enfoque, puede virtualizar los recursos de almacenamiento físico local de sus hosts ESXi y convertirlos en una SAN virtual completa. VMware VSAN me viene a la mente de inmediato, pero quisiera señalar algunas alternativas muy interesantes que deberían ser mucho más baratas de implementar en el entorno ESXi. El primer candidato es HPE VSA: buen nivel de funcionalidad y un requisito molesto de un tercer nodo de votación para un quórum. Sí, lo sé, aún puedes ir a 2 nodos, pero si no estás de acuerdo con el tiempo de inactividad, el quórum es imprescindible. El segundo candidato, por el contrario, tiene una huella de hardware minimalista con solo dos hosts físicos junto con un conjunto de características como almacenamiento en caché, compresión de datos, etc. Es StarWind vSAN . Ambas soluciones tienen versiones gratuitas, solo verifique y vea cómo se beneficiaría de ellas.

batistuta09
fuente
2

La tecnología que mejor le servirá es "almacenamiento definido por software". Una máquina virtual que hace que los discos conectados localmente estén disponibles para todas las máquinas virtuales, idealmente proporcionando redundancia al permitir el uso de discos locales en múltiples nodos al mismo tiempo (lo que le permite perder un nodo sin perder todas sus máquinas virtuales). Como no estamos hablando de recomendaciones de productos, lo dejaré aquí. Todavía es un mercado incipiente, pero hay algunas opciones bien establecidas que encajarían perfectamente.

Albahaca
fuente
2
La necesidad de capacidad de 200 GB hace que esto sea un poco complicado. El OP debe delinear el presupuesto.
ewwhite