El tráfico NLB se detiene en todos los nodos cuando se reinicia un solo nodo

1

Teníamos un clúster NLB de 2 nodos que ejecuta sitios web IIS en máquinas virtuales. Ambos nodos estaban en línea, el equilibrador funcionaba exactamente como se esperaba, (si el tráfico está equilibrado al 50/50, y usted detiene o drena un nodo, todas las rutas de tráfico se conectan sin problemas al otro nodo).

Pero cuando reinicié un nodo, incluso si lo detuve antes de reiniciar, el OTRO nodo que debería estar recibiendo tráfico de producción durante el reinicio dejó de aceptar solicitudes.

Que yo sepa, NO fue así como se supone que funciona NLB. Si apago un nodo, los otros nodos en el clúster NLB no deberían preocuparse, y deberían continuar aceptando el tráfico de acuerdo con sus reglas de puerto mientras el nodo fuera de línea se reinicia.

Ninguna de mis reglas de puerto empleaba afinidad, así que sabía que ese no era el problema.

Entonces, después de agonizar un poco, me topé con la respuesta (ver mi respuesta publicada)

Soporte de TI
fuente

Respuestas:

0

Después de investigar un poco, descubrí que el problema está relacionado con VMWare y el hecho de que el clúster NLB está en modo Unicast.

Aparentemente, VMWare debe configurarse correctamente para evitar problemas a nivel de conmutador con direcciones MAC virtuales que se crean a partir de clústeres NLB en modo unidifusión, y recomienda configurar las NIC para acomodar el modo, o mejor aún, simplemente use clústeres NLB en modo multidifusión para evitar El problema por completo.

NLB Unicast Clusters y VMWare

Soporte de TI
fuente