¿Deben apagarse los servidores por la noche?

144

Hay un servidor que se utiliza desde las 4:30 de la mañana hasta las ~ 22:00.

¿Debería estar apagado? Creo que es un servidor y que no tendrá problemas para permanecer, pero los profesores serios me dicen que es peligroso y que la HD puede fallar en 2 años. El propietario del servidor cree que su antiguo servidor que funcionaba desde 1995 sin respaldo y un solo disco duro (si el disco duro falla está atornillado) no tuvo ningún problema porque solía apagarlo por las noches.

¿Qué crees para esto?

Ahora tiene una matriz RAID 1, una copia de seguridad externa del disco duro y varias copias de seguridad completas del disco duro en DVD y en Internet.

GorilaApe
fuente
6262
+1 porque a pesar de que esta es una pregunta que no creo que ninguno de nosotros haya tenido alguna vez en mente, es evidente que algunas personas lo hacen y debe ser respondida.
Mark Henderson
8
Sus profesores no están ejecutando servidores. Están ejecutando estaciones de trabajo con demonios de red.
Bacon Bits
44
¿No puedes usar algunas configuraciones de energía para hacer girar los discos duros cuando no están en uso? El mismo beneficio en términos de desgaste, pero no tiene que apagar toda la máquina.
Brendan Long
34
Profesores de Inglés Lit?
Iain Holder
28
No recomendaría recibir consejos de personas que no realizan copias de seguridad. Especialmente no, si hacen esto por más de 15 años. El ahorro de energía eléctrica es el único argumento para apagarlo. La vida útil se reducirá debido al calentamiento y enfriamiento cada día.
Malte

Respuestas:

153

Para compararlo con la analogía de un automóvil: un taxi puede recorrer más de 500,000 kilómetros antes de necesitar una reconstrucción del motor. La razón de esto es porque siempre están funcionando, las 24 horas del día, los 7 días de la semana, y después de que el motor de un automóvil está a temperatura, la cantidad de desgaste que recibe mientras está funcionando se reduce en gran medida.

Una computadora es más o menos igual. La mayoría del "desgaste" en las piezas puede ocurrir cuando el servidor se está iniciando. Simplemente conecte un medidor de amplificador a su computadora y enciéndalo. Cuando se inicia, la potencia que consume sube muy alto, y luego se estabiliza una vez que todos los discos han girado y el procesador está inicializado. Además, piense en cuánta actividad de disco sufre el servidor durante el arranque en comparación con cuando funciona. Lo más probable es que el acceso al disco desde el arranque del sistema operativo sea una actividad bastante sólida, mientras que cuando el sistema operativo se está ejecutando, a menos que sea un servidor de base de datos muy pesado (supongo que no), los discos probablemente permanecerán bastante inactivos. Si en algún momento va a fallar, es probable que esté en el arranque.

Encender y apagar su servidor es una idea estúpida. No solo para mencionar que la mayoría de los servidores pueden tomar más de 2 a 5 minutos para superar las comprobaciones del BIOS, también es una gran cantidad de tiempo perdido.


Actualización de 2018: Dado que la mayoría de las computadoras ahora son casi completamente de estado sólido, esta respuesta ya no puede ser tan precisa como lo era antes. La analogía del taxi realmente no se adapta a los servidores modernos de hoy. Dicho esto, normalmente todavía no apagas los servidores.

Mark Henderson
fuente
15
¿Podría agregar algunos enlaces para investigar sobre este tema?
mafu
15
@mafutrct: WikiBook on HD Failure y Google Labs Study on HD Failure muestran evidencia poco convincente para sugerir que los ciclos de potencia impactan la vida de la unidad, y el tiempo de actividad total no es tan bueno como el lote / suerte del sorteo. También cosas obvias como el trauma físico tienen el mayor efecto.
Chris S
3
¿Cómo alimentan el taxi si siempre está funcionando? Eso es ilegal en la mayoría de las jurisdicciones.
ligereza corre en órbita el
8
@Tomalak: bueno, el punto de la analogía fue que el motor del Taxi está a temperatura y se produce menos desgaste durante este tiempo. En los 90 segundos que se tarda en reabastecer de combustible un Taxi, el motor no tiene posibilidad de enfriarse y, por lo tanto, el desgaste sigue disminuyendo. En una computadora, se "enfría" (para los fines de la analogía) al instante, y cada inicio es un inicio "en frío".
Mark Henderson
66
@Fergus: bueno, esto solo se aplica a las cajas físicas. Si tiene una VM, siéntase libre de encenderla / apagarla todo lo que quiera. Pero no obtendrá ningún ahorro de vida o de energía.
Mark Henderson
70

Apagar y encender el servidor todos los días probablemente hará que falle más rápido que dejarlo encendido.

HostBits
fuente
3
Muy probablemente debido al estrés del disco @ boot; Además, tenía un servidor que funcionaba felizmente durante años y luego se negaba a aparecer en el reinicio. Resulta que el disco de arranque se estaba degradando lentamente, con el MBR completamente ilegible, pero el MBR solo se leía al arrancar, por lo que nadie se dio cuenta. Afortunadamente, el disco murió por completo solo después de una frenética carrera por recuperar lo que no estaba respaldado todavía.
Piskvor
Dudo que esto suceda con el apagado una vez al día, incluso los discos empresariales tienen un recuento de 300,000 interruptores en sus detalles técnicos. El problema proviene de la gestión energética que lo hace cada 15 minutos.
Lothar
No entiendo cómo una respuesta que expresa simplemente los pensamientos de alguien sin ningún razonamiento de lo que alguna vez recibió 70 votos a favor.
Bassie-c
52

Lo único que puedo ver que es casi correcto acerca de lo que le han dicho es que las unidades pueden fallar en 2 años. De hecho, pueden fallar en cualquier momento. Estoy seguro de que la mayoría de nosotros hemos recibido al menos una unidad nueva que era DOA. En promedio, las unidades de servidor durarán desde unos 3 años en adelante, con 10 o 20 años no siendo demasiado infrecuentes. Eso no significa que ninguna unidad individual fallará mucho antes.

Los servidores (es decir, una máquina con componentes adecuados para servidores) están diseñados para ejecutarse continuamente. No hay ninguna razón para apagarlo por la noche, pero sí algunas muy buenas para dejarlo en funcionamiento. La noche, o cualquier otro momento que sea "silencioso" para un sistema dado, es el momento de ejecutar todo el mantenimiento y la automatización.

Por ejemplo, las copias de seguridad se toman mejor cuando hay poca o ninguna actividad del usuario. Esto ayuda a garantizar que las copias de seguridad sean consistentes. Seguro que hay maneras de evitar esto, pero ¿por qué no dar a sus copias de seguridad todas las posibilidades de éxito cuando no hay nada que perder al hacerlo?

Alguien que ejecuta un "servidor" con un solo disco y sin respaldo es un tonto, no un administrador. La única razón por la que se salió con la suya es pura suerte. No tenía absolutamente nada que ver con apagar la máquina por la noche.

John Gardeniers
fuente
Voy a adivinar y decir que el "administrador" que no está haciendo copias de seguridad tampoco está usando componentes adecuados para el servidor.
intuido
23

Los servidores están destinados a operar 24x7. El cierre de los servidores durante la noche es extremadamente inusual. Los discos duros del servidor están diseñados para ser más confiables que las unidades de escritorio y ahora que tiene copias de seguridad y RAID 1, no sufrirá pérdida de datos si falla una de sus dos unidades.

Lo que me preocuparía ahora para este servidor de 16 años es una falla de la placa base o de la fuente de alimentación no redundante.

Subred Cero
fuente
Parece lógico :) Es un motorola pc power pc .. todavía no ha muerto!
GorillaApe
13

Nunca antes apagué un servidor por la noche.

Los discos duros fallarán cuando van a fallar. Encender y apagar la máquina no hará que la unidad falle más lentamente. He visto discos duros enviados por el proveedor que ya estaban en mal estado, y he visto discos funcionando (y siendo utilizados activamente) por más de 5 años sin fallar.

Tus profesores son idiotas.

mrdenny
fuente
2
Encender y apagar la máquina definitivamente hará que la unidad falle más lentamente si se deja apagada durante períodos de tiempo suficientemente largos. Si apaga la máquina durante 10 años, se garantiza que la unidad durará al menos 10 años. La pregunta es por cuánto tiempo se debe dejar la máquina promedio para tener un efecto positivo.
intuido
44
@intuited Si enciende la máquina después de 50 años de espera y la unidad no arranca, ¿duró 0 años, 50 años o qué?
Cade Roux
@Cade Roux: No tengo idea. ¿Que importa? Incluso si lo consideramos como 0, este valor atípico no va a cambiar significativamente el promedio general.
intuido
1
@intuited que era una broma - pero en realidad, es probable que sesgar la media research.google.com/archive/disk_failures.pdf Y a partir de estos datos, es posible que una nueva unidad de encendido después de estar sentado en el estante a 5 años será es más probable que falle que una unidad en funcionamiento durante 5 años. El punto es discutible porque no vale la pena dejar que el hardware permanezca inactivo más de lo que lo hace para apagarlo y volverlo a encender. El hardware se degrada y queda obsoleto y necesita que se use su valor máximo antes de que se desgaste y se reemplace.
Cade Roux
@Cade Roux: De la investigación de Google a la que se vinculó: Como es común en las implementaciones de clase de servidor, los discos se encendieron, giraron y, en general, estuvieron en servicio durante esencialmente toda su vida registrada. Entonces esa investigación no es relevante aquí. Demuestra que la unidad aún nueva tendrá más probabilidades de fallar que la anterior durante un período de tiempo determinado después de volver a encenderse, pero esto supone que la unidad anterior no ha fallado durante los 5 años que estuvo corriendo.
intuido
11

Esto también pone un "aspecto humano" más grande en el servidor. Incluso si usa la configuración de energía para apagarlo y encenderlo en los momentos correctos, debe hacer que alguien monitoree el servidor para asegurarse de que todos los servicios requeridos, etc., se inicien correctamente. Es un tiempo precioso que puede enseñar a los profesores sobre copias de seguridad y RAID.

¿Cuándo ejecutas las copias de seguridad? Daría cualquier cosa por un período de 6 horas para ejecutar mis copias de seguridad diarias, actualizaciones, revisiones, etc. Si nada más, este tiempo de inactividad se puede utilizar para eso.

Te reto a que vayas con estos "profesores serios" y les proporciones una investigación que demuestre que dejar la computadora encendida 24x7 es malo. Me gustaría respaldar lo que dicen.

Theo
fuente
Lo dije en serio porque uno de ellos ha diseñado procesadores, los sistemas integrados conocen el núcleo de Linux con gran detalle. En cuanto a las copias de seguridad, he creado scripts para copias de seguridad automáticas, pero luego el propietario y el administrador me parecían WTF. "NO, quiero hacerlos manualmente a diario" y no "alquitránarlos y comprimirlos".
GorillaApe
2
@Parhs En pocas palabras, eres más inteligente que tus superiores. Sería prudente de su parte renunciar y encontrar un verdadero mentor antes de pasar demasiado tiempo a la sombra de idiotas que no le permitirán hacer lo correcto.
Skyhawk
10

Siendo realistas, se espera que la mayoría de los servidores estén disponibles 24/7. Llano y simple.

Si el suyo no es así, existe un gran debate entre el cual causará más desgaste en su servidor, la constante expansión y contracción entre encender su servidor y calentarlo, y luego apagarlo y enfriarlo , o el desgaste de los componentes por el uso constante.

Todavía no he visto ninguna investigación sobre qué es peor, y dudo mucho que su profesor tenga acceso a alguna investigación que afirme de manera diferente.

Al final, tendrá que tomar la decisión en función de sus necesidades, pero el costo beneficio para la mayoría de las empresas es tener sus servidores y servicios disponibles todo el tiempo, no solo cuando alguien entra y lo enciende. Especialmente cuando hay un debate de que de hecho puede estar causando más problemas a sus servidores al apagarlos.

rfelsburg
fuente
7

Lo más importante es el enfriamiento. La refrigeración hace una gran diferencia. La temperatura dentro de la caja puede ser mucho más alta que la habitación. Instalaría software para monitorear eso como el Everest. Comparando los discos duros modernos con los que reemplazó, se ejecutan en caliente. Algunos necesitan ventiladores para enfriarlos. A veces, un ventilador pequeño puede hacer una gran diferencia. La vida útil del HD y del servidor dependerá de la refrigeración.

Joe en Michigan
fuente
5

Sí, no es una opción. Dígale a sus profesores que el estándar de la industria es dejarlos en funcionamiento las 24 horas del día, los 7 días de la semana y tener una garantía para el hardware defectuoso. Si el servidor tiene 16 años, imagino que no obtendrá esa garantía.
Si el servidor explotara, ¿qué tiempo de recuperación tendría para construir uno nuevo con la información respaldada? Comenzaría a insinuar a los clientes que su servidor ha llegado al final de su vida útil y que deberían comenzar a buscar fondos para uno nuevo.

xXhRQ8sD2L7Z
fuente
5

Es cierto que las tensiones mecánicas del ciclo de potencia son difíciles para el HDD. Además, había algunas unidades más antiguas que (cuando se enfriaban lo suficiente) podían dejar de funcionar por completo debido a "stiction".

Con circuitos diseñados de manera inadecuada, las corrientes de entrada al encender la máquina también podrían estresar algunos componentes, aunque esto no es tan probable.

Dicho esto, hay algo de verdad en que dejar la máquina encendida pasa factura: condensadores. Es probable que los numerosos condensadores electrolíticos en la placa base sean el eslabón más débil de la confiabilidad del sistema. Estos condensadores están clasificados por su capacidad de manejo de corriente / voltaje, temperatura de operación y vida útil. Los condensadores típicos tendrán una capacidad nominal de varios miles de horas. Las tapas de servicio pesado / larga vida están clasificadas para varias decenas de miles de horas y temperaturas más altas.

Esta es la razón por la que a veces se ven a la venta placas base con "condensadores de nivel de servidor", porque esas máquinas funcionan a toda velocidad las 24 horas del día, los 7 días de la semana y muerden su vida útil.

Constructor de juguetes
fuente
Hace más de 15 años escuché el término 'estadística de disco' o algo así, la explicación dada fue después de funcionar durante años que los polímeros en los lubricantes de disco comienzan a formar cadenas largas y cuando el disco se apaga y deja de girar los rodamientos aprovechar y no comenzará de nuevo '. Las fallas de alimentación en un DC generalmente significaban que un montón de servidores no se reiniciarían. Por supuesto, no tengo idea de qué discos usan ahora como / en lugar de rodamientos.
jqa
+1 por restricción. Me preguntaba si alguien lo mencionaría. @james, se llama "restricción", y se ha trabajado mucho para encontrar lubricantes para las unidades que no se espesan con el tiempo, uso / abuso. Las cosas son mejores de lo que solían ser, pero encender y apagar las unidades todavía no es una buena idea porque es más probable que mueran cuando golpea la energía, ya sea porque un componente explota o los motores de accionamiento no pueden comenzar a girar los platos
Greg
La mayoría de las placas base producidas a partir de 2008 (quizás antes) ahora usan condensadores de estado sólido, que tienen una vida MUCHO MUCHO mayor que la de los electrolíticos. Las fuentes de alimentación son ahora el único lugar donde aún se ven condensadores electrolíticos.
Mircea Chirea
Eso es stiction (palo + fricción), no striction. :-)
poco el
2

Cuando hice que el servidor recibiera mantenimiento preventivo mensual del fabricante, comenzaron con un apagado cada mes. Esto tendía a provocar fallas en los componentes. El horario cambió a trimestralmente, luego solo cuando fue necesario. No recomendaría apagar un sistema tan antiguo a menos que fuera necesario.

BillThor
fuente
Sí, también he visto servidores con más de 1000 días de tiempo de actividad. Pero no reiniciar regularmente (cálido) es un pecado; es mejor encontrar un sistema fallido después de un reinicio planificado que después de uno no planificado. Además, estos reinicios tienden a descubrir contratiempos de configuración.
sjas
1

Una cosa que no se menciona es que la mayoría de los servidores tienen tareas de mantenimiento que realizan diariamente, semanalmente o mensualmente. Casi siempre se programan para la mitad de la noche, cuando se espera que la actividad sea la más baja.

En un sistema Red Hat, por ejemplo, estas actividades comienzan a las 4:02 am hora del servidor. Dependiendo del servidor, estos podrían ejecutarse durante unos segundos a una hora o más. Si enciende el servidor a las 4:30, estas tareas de mantenimiento comenzarán de inmediato (por anacron) y los primeros usuarios que inicien sesión entre entonces y las 5 de la mañana se verán afectados en cierta medida.

Michael Hampton
fuente