¿Con qué frecuencia se deben reiniciar los servidores de Windows?

77

Un poco de historia: tenemos varios servidores de Windows (2003, 2008) para nuestro departamento. Somos una división de TI, por lo que gestionamos nuestros propios servidores. De los cuatro que estamos aquí, soy el único con un poco de conocimiento de TI. (Tenga en cuenta la "pequeña cantidad".) Mi jefe dice que los servidores deben reiniciarse al menos semanalmente. Estoy en desacuerdo. Nuestro departamento de TI dice que debido a que los reinicia constantemente, esa es la razón por la cual nuestros discos duros fallan y las fuentes de alimentación se apagan. (Eso les sucedió a algunos de nuestros servidores un par de veces en los últimos cuatro años, y muy recientemente).

Entonces la pregunta es: ¿con qué frecuencia todos reinician sus servidores de Windows? ¿Existe un estándar o recomendación de la industria? ¿Es correcto nuestro departamento de TI al decir eso porque reiniciamos por eso tenemos problemas de hardware? (¡Necesito una razón si voy a cambiar de opinión!)

Evan
fuente
111
Oh, aproximadamente cada segundo martes del mes . :)
jscott
44
Dang! ¡Lo estábamos haciendo cada cuarto jueves del mes! :)
Evan
2
Estoy en el bote opuesto. No se nos permite reiniciar los servidores sin un debate de ida y vuelta de una semana entre todo el departamento, que toma alrededor de 12 horas hombre por servidor. Sí, esto incluye reinicios para parches, lo que significa que nunca se hace.
Hyppy
19
Reiniciar semanalmente tampoco debería causar un aumento drástico en las fallas de hardware.
JamesRyan
3
Parece que sus servidores se reinician con más frecuencia que mi computadora portátil. Generalmente lo pongo en modo de suspensión cuando no lo estoy usando. La razón habitual para reiniciar es instalar actualizaciones de Windows o software.
Phil

Respuestas:

116

Mi jefe dice que los servidores deben reiniciarse al menos semanalmente

Estoy totalmente en desacuerdo. Microsoft ha hecho grandes avances desde los buenos días [NT, ¿alguien?] Con respecto a la estabilidad y el tiempo de actividad. Es una pena que el consenso dentro del soporte de TI no haya cambiado junto con esto.

¿Con qué frecuencia todos reinician sus servidores de Windows?

Solo cuando sea necesario : ya sea debido a una actualización del sistema operativo / software, una falla crítica del software que no puede recuperarse a través de otros métodos, actualización / reemplazo de hardware u otra actividad que no puede ocurrir sin un reinicio. 1

¿Existe un estándar o recomendación de la industria?

Nunca he visto una recomendación estándar, per se , pero no podría estar de acuerdo con ninguna recomendación [excepto de la propia MS] que indique un reinicio requerido en un intervalo de tiempo específico "solo porque".

¿Es correcto nuestro departamento de TI al decir eso porque reiniciamos por eso tenemos problemas de hardware?

Reiniciar [y, más aún, el ciclo de energía] es el período más estresante de actividad de hardware para una computadora. Tiene casi todo girando al 100%: disco y ventiladores ... ... así como fluctuaciones significativas en las temperaturas de los componentes. El hardware moderno es increíblemente resistente, pero eso no debería ser una razón para simplemente rebotar servidores, por capricho, algunas veces a la semana.

1 Aparte, odio cuando los técnicos "simplemente" reinician un servidor de Windows en el caso de un servicio fallido o similar. Entiendo la necesidad de volver a ejecutar el servicio, pero un reinicio debería ser el último paso en la resolución de problemas de un servidor. Identificando y solucionando [!], La causa raíz de la falla casi nunca debería resultar en "Meh, solo reinícielo ..."

revs jscott
fuente
2
Gracias por la respuesta completa. Hacemos actualizaciones una vez al mes, lo que obviamente cuando hacemos las tenemos que reiniciar. Agradezco la respuesta.
Evan
55
Tengo que estar en desacuerdo con su apéndice. Si el servicio define el servidor (por ejemplo, un servidor NFS que deja de compartir exportaciones), y sabe que un reinicio limpio volverá a activar el servicio en X minutos, y después de la resolución de problemas básica, determina que tomará x + 5 para resolver el problema. problema, es más conveniente simplemente reiniciar. Puede hacer un análisis de causa después. Ahora, ese es mi método de hacerlo de todos modos, y usted podría argumentar a favor y en contra con bastante facilidad :) Justo cómo ruedo.
Mateo
34
@Matthew: Realizar un análisis de la causa raíz después del hecho está muy bien si no hay información transitoria sobre la causa perdida al reiniciar. Creo que hablo por varias personas cuando digo que prefiero tener un tiempo de inactividad extendido más para descubrir y solucionar la causa raíz de una interrupción que varios incidentes de tiempo de inactividad más cortos cuando decido "simplemente reiniciar" y potencialmente pierde la capacidad de usar información volátil para ayudar en el análisis de la causa raíz.
Evan Anderson
8
@Matthew En casos de falla del servicio, esperaría que el técnico intente reiniciar el servicio , como un paso de solución de problemas, antes de reiniciar todo el cuadro.
jscott
66
@Evan Estoy de acuerdo contigo, sin embargo, creo que debe haber un umbral de incidentes que se conviertan en un problema. Por ejemplo, si ocurre una vez al mes y se resuelve en 10 minutos con un reinicio, es posible que a la empresa nunca le importe la causa raíz. Creo que usted y yo quisiéramos saberlo, pero el tiempo de actividad es más importante que la causa raíz. Sin embargo, si sucede 3 veces a la semana, es una historia completamente diferente.
Jim B
52

Los servidores de Windows deben reiniciarse mensualmente, si está aplicando parches. Estás aplicando parches, ¿verdad? ¿Derecho?

Hippy
fuente
8
+1 por hacerme jajaja
3
¿Solo aplica parches mensualmente?
John Gardeniers
Hablando estrictamente, xe solo aplica los parches que requieren reiniciar mensualmente. No todos los PTF requieren un reinicio, y no todas las actualizaciones mensuales contienen ninguna solución de este tipo.
JdeBP
2
Solo reinicio los servidores de Windows cuando una actualización lo requiere . A veces pasará un par de meses sin un parche que requiera un reinicio. Sin embargo, sí tengo servidores Linux que no se han reiniciado en años y se ejecutan sin problemas. Creo que lo más largo que he visto en mi red es una caja de Linux que se puso en un armario y se olvidó (recibió actualizaciones automáticas). Entré y el tiempo de actividad fue de 3 años. Un año después se reinició debido a un fallo en el suministro de energía.
James
Si se tratara de Linux o BSD, podría parchear su servidor sin necesidad de reiniciar. Solo debe reiniciar para las actualizaciones del kernel (y con una distribución orientada al servidor, son infrecuentes).
SnakeDoc
18

Daré una respuesta alternativa para un caso muy específico. Los avances de los últimos 2-3 años pueden haber cambiado esto, pero si tiene servidores TS o Citrix muy utilizados que ejecutan muchas aplicaciones interactivas (como Office), ha sido una buena idea realizar reinicios semanales fuera del horario laboral, solo para comenzar desde una pizarra limpia para recursos como sesiones bloqueadas, montón de escritorio usado, etc. Si tiene su granja configurada correctamente y escalona los reinicios, incluso si tiene un uso ligero fuera de horario, los usuarios no deberían verse afectados.

Claro, se trata de reinicios regulares de servidores, pero se están utilizando como escritorios.

mfinni
fuente
44
Mm ... buena decisión sobre el caso TS / Citrix.
Hyppy
Experiencia similar aquí usando Citrix con el software de gestión de auditoría de CCH.
1
Lo mismo se aplicaba en los días de MetaFrame, cuando Citrix mismo recomendaba reinicios nocturnos si eso era práctico.
John Gardeniers
Sí, Metaframe ... whoof. No extraño jugar con el archivo de mapeo del controlador de la impresora. Ciertamente ha mejorado mucho desde una perspectiva de gestión de TI.
mfinni
10

Este es más un problema político y psicológico que técnico.

En mi experiencia, ciertas personas que trabajaron con algunas de las versiones mucho más antiguas de Windows se les ocurrió que necesitaban reinicios semanales, y han consagrado esa filosofía en un pequeño rincón de su mente (nunca parecen darse cuenta cuando Sin embargo, el reinicio se pierde cuando están de vacaciones). A menos que tenga algunos sistemas y aplicaciones muy inestables, ya no se basa en la realidad.

Por otro lado, los reinicios frecuentes pueden catalizar la falla del hardware, pero no es muy probable que sea la causa de la misma.

Shane Madden
fuente
77
Mi jefe es buena amiga del administrador de red retirado que le dijo que necesitaban reiniciarse al menos una vez a la semana ... lo que explica por qué ella es tan inflexible al respecto. Gracias por la respuesta.
Evan
55
No es de extrañar que esté "retirado" ... ¿eso es un eufemismo para despedido?
KCotreau
3

El único momento en que deberían reiniciarse es para mantenimiento si todo funciona correctamente . Los reinicios programados son realmente solo un requisito cuando A) actualiza el software, B) realiza el mantenimiento del hardware o C) lidia con una pérdida de memoria que no se puede resolver reiniciando el software / servicio que lo causó. Si bien Windows no se conoce por largos períodos de funcionamiento, sucede (el último trabajo tuvo algunas cajas Win2k que estuvieron activas durante meses a la vez, simplemente funcionaron). Solo recuerde que cualquier parche probablemente requerirá reiniciar.

Mateo
fuente
Gracias por la respuesta. Esto debería ayudar a persuadirla.
Evan
1
Encontré cajas de Windows NT, 2000 y 2003 en la red de trabajo que han estado funcionando durante varios años. y hasta hace poco, nuestro centro de datos tenía una política de parches anuales y con más de 600 servidores no es raro ver tiempos en el rango de más de 250 días. Mis servidores (tengo alrededor de 120) Se actualizan e inician cada parche de Microsoft. A veces, como el mes pasado, no tuvimos un ciclo. El tiempo de actividad depende de lo que se está ejecutando en el servidor y qué tan bien funcionan las cosas juntas. 2003 R2 con esas cosas que tengo que ejecutar necesita reiniciarse cada 35 días. cosas graciosas suceden después de eso.
Christopher Thornton
2

De ninguna manera soy un experto en el tema, pero dependiendo de los servicios que esté ejecutando, algunos pueden ser susceptibles de desbordarse en ciertas funciones de temporización, como timeGetTime () y getTickCount ().

timeGetTime tiene un resultado de 32 bits, que equivale a la cantidad de milisegundos desde que se inició la computadora. Esto alcanza un máximo de aproximadamente 49.7 días.

Mateo
fuente
2
Err, no. Tengo un servidor (en una red completamente aislada y confiable, no me predique) que ha estado funcionando durante la mayor parte de 14 meses sin efectos negativos.
Ben Pilbrow
3
No quise dar a entender que todos los servidores y las instancias tendrían este problema, sino que si el servidor utiliza un software que utiliza estas funciones y no las tiene en cuenta, se encontrarán con problemas de computación.
Mateo
2
El problema del temporizador de 32 bits es válido, pero es un problema que los proveedores de software individuales deben evitar cuidadosamente en su propio código. Windows ya no es susceptible a fallas relacionadas con este temporizador (como lo era en el pasado), pero si tiene un software instalado que no tiene en cuenta la reversión del temporizador, puede causar efectos imprevistos.
tylerl
1
¿Te refieres a este KB de Microsoft ?
jscott
99
Err esto es un error NT 4 win 2k + no sufren de esto. Creo que podemos decir con seguridad que NT 4 está muerto en 2011. y si alguien en algún lugar lo está ejecutando ... se merecen lo que obtienen en este momento.
Zypher
2

Solía ​​reiniciar todos mis servidores de Windows cada semana y ciertamente hubo un momento en que era necesario. En estos días solo los reinicio cuando una actualización lo requiere. Por supuesto, eso significa que aún se reinician cada pocas semanas de todos modos.

John Gardeniers
fuente
2

Microsoft ha hecho un gran trabajo al mejorar el sistema operativo de su servidor a lo largo de los años. Y algunos servidores que puede ejecutar durante 6 a 12 meses antes de que comiencen a experimentar problemas, algunos solo lo hacen de 2 a 3 meses. Todo depende de qué servicios y aplicaciones estén ejecutando los servidores. Pero todos tendrán un problema en algún momento. Las actualizaciones de Windows, las pérdidas de memoria, el software imperfecto, son solo algunas de las razones.

Para nuestros clientes con contratos de mantenimiento, instalamos actualizaciones y reiniciamos sus servidores mensualmente. Estos clientes tienen una indecencia mucho menor de problemas de servidor no planificados, del orden de 1/5 de problemas que aquellos que no se reinician regularmente.

Para aquellos que dicen que reiniciar causa fallas prematuras en el hardware, hubo un tiempo en que reiniciar los discos duros y los sistemas era un problema potencial. Sin embargo, hoy en día los HDD y otros componentes están diseñados para soportar miles de ciclos de inicio y parada. Si el hardware de su servidor es débil, ¿preferiría saberlo en un momento controlado cuando esté allí para abordar el problema rápidamente, o una falla aleatoria con una llamada en medio del día hábil que dice que un departamento está fuera de servicio?

Siento que no hay inconvenientes en los reinicios mensuales regulares, mientras que las ventajas son claras y probadas con el tiempo.

Todd H
fuente
1

Confío en las actualizaciones de Windows para configurar mi 'programa de reinicio'. Deje que Windows se administre solo ... ¡por una vez! Muy raramente se requiere un reinicio con nuestra configuración debido a pérdidas de memoria ...

louisnorthmore
fuente
1

Soy administrador de red en una empresa que opera en varios servidores Windows 2003 2008. Reinicio los servidores mensualmente, por lo general, no esperan más de 3 meses, ya que es muy importante estar inactivo durante ese corto período de tiempo.

Sin embargo, con parches y actualizaciones de Windows, instalaré WSUS en un controlador de dominio para aplicar actualizaciones, etc., en un horario basado en mi gusto. Esto es para evitar que los servidores se actualicen y se reinicien inesperadamente ...

GMitch
fuente
1

Todos los que odian a Windows deben visitar los sitios de Netcraft.com con los sistemas de ejecución más largos por tiempo de actividad promedio ( http://uptime.netcraft.com/up/today/top.avg.html ). Esto muestra los sitios que han estado funcionando más tiempo desde su último reinicio y el 95% de los 50 principales son máquinas con Windows 2003 y 2000. Como siempre, su kilometraje puede variar.

Mark Lawrence
fuente
Quizás no sabes demasiado sobre el equilibrio de carga ...
mfinni
0

Especificar solo Windows podría ser demasiado amplio para tomar una decisión razonable. De hecho, tomará una mejor decisión si considera los servicios, roles y características que ejecuta en la máquina Windows (por ejemplo: servicios web, servidores de bases de datos, etc.).

La calidad y el comportamiento de las aplicaciones de terceros y los servicios web que se ejecutan en un servidor específico pueden sugerir una demanda de reinicio más / menos frecuente de la máquina Windows de alojamiento que otras máquinas sin ellos.

En realidad, algunas aplicaciones de terceros (una no diseñada perfectamente; ¡aunque nadie es perfecto! ) Pueden no liberar los recursos del sistema adquiridos, como la memoria, los bloqueos y los zócalos de manera elegante y oportuna. Esto, por ejemplo, puede mantener algunas aplicaciones, servicios o controladores bloqueados [, cuando se vuelven a ejecutar,] en estado pendiente o de inicio que podrían no solucionarse fácilmente sin un reinicio.

En la práctica, las aplicaciones hambrientas de E / S de disco, de red y de memoria bajo una carga de trabajo alta y estresada y con bajos recursos del sistema disponibles pueden hacer que su máquina Windows se quede retrasada, inestable o desechada, lo que puede sugerirle que las reinicie antes.

Si tiene que ejecutar aplicaciones tan defectuosas o debe atender a más usuarios que la capacidad típica de su hardware / software, o si se ve obligado a ubicar servicios incompatibles en una máquina física, puede tomar la decisión de reiniciar Windows periódicamente En este caso, puede ajustar el período de reinicio escuchando las quejas de los usuarios sobre la velocidad del servidor.

FIV
fuente
-6

La respuesta correcta nunca es a menos que haga una actualización de software. La última vez que reinicié mi servidor hace unos 2 años y la razón fue un fallo de alimentación.

Dmitriy R
fuente
3
Espero que estés bien hablando de un servidor Linux o espero que su servidor no está en uso profesional ...
HTDutchy
3
Todos los servidores que reciben parches deben reiniciarse para aplicar algunos de esos parches. Cualquier servidor que esté expuesto a una red pública debe ser parcheado.
carne fermentada
Tengo un par de controladores de dominio NT 4 que se inician aproximadamente una vez al año. No más actualizaciones y ya no son el blanco de los malos ... (no se enfrentan a Internet)
hsmiths