Tenemos una caja SAN EMC NX4 que sirve un recurso compartido CIFS a varios servidores de aplicaciones de Windows Server 2008 R2. Los servidores de aplicaciones están utilizando el recurso compartido CIFS para servir muchos archivos de imagen (~ 2500 operaciones / segundo en el recurso compartido), sin embargo, ni la SAN ni los servidores de aplicaciones muestran signos evidentes de estrés.
De vez en cuando, un servidor de aplicaciones, aparentemente de repente, desconecta la conexión a la SAN. Cualquier código .NET que intente servir un archivo desde la SAN falla con:
System.IO.IOException: The specified network name is no longer available
Si RDP al servidor de aplicaciones e intento acceder a "\ san-name" a través del explorador, obtengo el mismo error. Todos los demás servidores de aplicaciones pueden acceder a él perfectamente. También puedo acceder a "\ ip-of-san" perfectamente, el ping funciona también.
Un reinicio del servidor de aplicaciones soluciona el problema, pero esa es una medida un tanto drástica del problema, dado que parece que la SAN está funcionando bien y la computadora puede acceder a ella, solo parece que el acceso "\ san-name" tiene vomitado.
Esto ha sucedido con dos servidores de aplicaciones diferentes durante la última semana, por lo que no sospecho que un solo servidor de aplicaciones sea la causa. Ignorando la causa por ahora, ¿cómo restablecería la conexión "\ san-name" sin reiniciar la máquina? ¿Y de alguna manera puedo preguntar qué salió mal?
Los registros de eventos no muestran nada (además de los errores relacionados con ASP.NET causados por el problema), ni en los servidores de aplicaciones ni en la SAN.
Actualización:
según las sugerencias, intentaré reiniciar el servicio de estación de trabajo la próxima vez y veré si eso ayuda al problema. Definitivamente no es una solución, pero es mucho más rápido que reiniciar toda la máquina como lo he estado haciendo actualmente. ¿Alguna forma de consultar el estado de las conexiones que mantiene el servicio de estación de trabajo?
Actualización 2: se
confirmó que reiniciar el servicio de estación de trabajo "soluciona" el problema. El siguiente paso es probar el cambio de registro para aumentar el valor de MaxCmds. No podrá confirmar si se trata del problema, solo puede suponer si se ejecuta durante un período prolongado sin problemas.
fuente
Respuestas:
Esto suena como si los MaxCmds se hubieran agotado. Aquí hay dos buenos artículos sobre eso: aquí y aquí .
Aquí está ahora para cambiarlo. Cree un archivo llamado update.reg y coloque lo siguiente en él:
Guarde y luego haga doble clic y acepte la solicitud. Se requiere un reinicio.
fuente
¡quizás reinicie el servicio de estación de trabajo en el servidor de aplicaciones!
fuente
He tenido casos como este antes, aunque no con un backend EMC. Para las aplicaciones de usuario, forzar el cierre de la conexión al servidor remoto y volver a abrirlo lo traerá de vuelta, aunque es posible que tenga que intentarlo un par de veces antes de que funcione. Para aplicaciones de servidor, el reciclaje del grupo de aplicaciones para ese servicio funciona. Si eso falla, reciclar el Servicio de estación de trabajo puede evitar un reinicio, pero es casi tan drástico.
fuente
En la fuente:
¿Podría dar más detalles sobre el software instalado en el servidor de aplicaciones? En la red encontrará que generalmente es un problema con un AV, pero dado que no ejecuta ninguno ... ¿tal vez otra aplicación en modo kernel como un software de respaldo?
¿Está activo el firewall? ¿Ha verificado los registros de eventos en DC para el servidor de aplicaciones defectuoso?
También debe detectar el tráfico de red CIFS cuando surja el problema para ver qué sucede.
Las únicas veces que me encontré con este error fueron cuando el servidor / estación de trabajo de alguna manera "perdió" su enlace con el dominio. Reforzar la membresía de dominio hizo el truco (netdom / resetpwd). ¿Puede acceder a otros recursos compartidos de red (desde la sesión RDP al servidor de aplicaciones) cuando surge el problema?
fuente
¿Puede ser un problema con la resolución de nombres? ¿Puedes consultar con tu servidor DNS? Si eso no permite resolver el nombre y después de reiniciar su servidor de aplicaciones, le permitirá acceder.
Tuve el mismo problema cuando algunos usuarios de la estación de trabajo se quejan de que no pudieron acceder a la aplicación almacenada en otro servidor, hicimos lo mismo al tratar de acceder con server-ip que funcionaría pero no con el nombre, por lo que hemos verificado el DNS. Hemos realizado cambios en la Aplicación para acceder a otro servidor para usar la dirección IP ya que tenemos una red IP estática.
Avísame si mi sugerencia funciona para ti.
fuente
Me encontré con un problema similar. No pude asignar un recurso compartido a Windows Server 2012 desde un servidor Windows 2003.
El grupo de red había implementado una política AD que había aislado las versiones inferiores de Windows a un contenedor AD que no permitía que una versión inferior de TLS se conectara a servidores que ejecutaban versiones superiores de TLS. Mover el servidor hacia atrás o deshabilitar la política para conectarse con una versión inferior de TLS corrigió este problema.
Aquí hay algunos errores que encontré en el registro del sistema:
Espero que ayude a resolver su problema.
fuente