** ¿Qué tan dañino es un ciclo de giro del disco duro?

53

Es una sabiduría convencional¹ que cada vez que gira un disco duro hacia abajo y hacia atrás, reduce un poco su tiempo de vida útil.

El tema ha sido discutido antes:

Las explicaciones comunes de por qué los spindowns y los spinups son perjudiciales son que inducen más estrés en las partes mecánicas que el funcionamiento normal, y que causan variaciones de calor que son perjudiciales para la mecánica del dispositivo.

¿Hay algún dato que muestre cuantitativamente qué tan malo es un ciclo de centrifugado? Es decir, ¿cuánto cuesta la vida útil de un ciclo de centrifugado? O, más prácticamente, si sé que no voy a necesitar un disco durante X segundos, ¿qué tan grande debe ser X para garantizar el giro hacia abajo?

¹ Pero la sabiduría convencional se ha equivocado antes; por ejemplo, se sostiene comúnmente que los discos duros deben mantenerse lo más frescos posible, pero el único estudio publicado sobre el tema muestra que las unidades más frías en realidad fallan más. Este estudio no es de ayuda aquí ya que todos los discos encuestados fueron encendidos 24/7.

Gilles 'SO- deja de ser malvado'
fuente
8
Parte de por qué surgió esta sabiduría convencional es la experiencia anecdótica con unidades que no giran después de girar, generalmente un problema visto con mayor frecuencia en unidades que han estado girando continuamente durante años. En estos casos, la edad es probablemente un factor mayor que el conteo del ciclo de centrifugado.
SysAdmin1138
1
La respuesta será diferente según el tipo de unidad (computadora portátil o de escritorio), RPM, etc. Si le preocupa la vida útil de morir en unidades que se usan con poca frecuencia, ¿tal vez necesite un SSD?
Daisetsu
2
Sí, dudo que los ciclos de centrifugado sean un factor importante. Como SysAdmin1138 menciona, es común que un disco viejo se niegue a girar después de girar durante un período relativamente largo (lo suficientemente largo como para que los cojinetes se enfríen), pero esto probablemente se deba a que el lubricante congelado se agarró, no tiene nada que hacer con el número de "ciclos".
Daniel R Hicks
3
Corriente de entrada
Ƭᴇcʜιᴇ007
1
@ SysAdmin1138, ¿sabe que, por ejemplo, WD Red solo se crea para unos pocos ciclos de centrifugado y largos tiempos de funcionamiento? -> por lo tanto, depende del tipo de unidad.
Offler

Respuestas:

14

No conozco ningún estudio sobre el tema, pero sí sé lo que me dicen los datos SMART :

Para un disco en particular (un WD Scorpio Blue 2.5 ") un recuento de inicio-parada de ~ 200,000 o un recuento de ciclo de carga de ~ 600,000 corresponde al valor SMART 0 (es decir, el disco está al final de su vida útil según SMART). (Esta es una unidad portátil, están hechos para manejar una mayor cantidad de ventanas que las unidades de escritorio).

Como estos valores provienen del fabricante, supongo que representan la mejor estimación del fabricante sobre lo que pueden manejar sus unidades. Al carecer de datos independientes, me inclinaría a pensar que la suposición del fabricante es probablemente mejor que la mía, por lo que probablemente podría ser peor que usar esos números para calcular la X.

jg-faustus
fuente
2
Entonces, según el número 200K, si reiniciara su disco duro cada hora, las 24 horas del día, duraría más de 20 años. Así que supongo que podemos usar esto como una guía para configurar nuestros tiempos de espera de apagado / reposo. Si usa el número 600K y solo aparece un spindown en lugar de que S3 duerma toda la máquina, ¿aparentemente puede configurar su Tiempo de espera inactivo incluso en 20 minutos? Dado que otros factores entran en juego mucho antes de 20 años, creo que podemos ignorar con seguridad los efectos de los ciclos de centrifugado.
Amit Naidu
5

Supongo que el problema que tendrá al encontrar literatura sobre este tema es que el área en la que se realiza la investigación de fallas de disco son los centros de datos comerciales, donde la latencia involucrada en los discos giratorios es inaceptable.

Dicho esto, encontré este documento del IEEE . Los autores proponen dejar que el segundo disco en una matriz RAID 1 gire hacia abajo hasta que sea absolutamente necesario. Denominan este RAREE (Enfoque de eficiencia energética con conciencia de fiabilidad). Aunque no son los datos cuantitativos lo que está buscando, su enfoque parece suponer que girar el segundo disco extenderá la vida útil de la matriz en general.

grw
fuente
5

El estudio de Google menciona el efecto de los ciclos de encendido:

Power Cycles. El indicador de ciclos de energía cuenta la cantidad de veces que se enciende y apaga una unidad. En una implementación de clase de servidor, en la que las unidades se alimentan continuamente, no esperamos alcanzar conteos de ciclos de energía lo suficientemente altos como para ver algún efecto en las tasas de falla. Nuestros resultados encuentran que para unidades de hasta dos años, esto es cierto, no existe una correlación significativa entre fallas y conteo de ciclos de alta potencia. Pero para las unidades de 3 años o más, los recuentos de ciclo de potencia más altos pueden aumentar la tasa de falla absoluta en más del 2%. Creemos que esto se debe más a nuestra mezcla de población que a los efectos del envejecimiento. Además, esta correlación podría ser el efecto (no la causa) de máquinas con problemas que requieren muchas iteraciones de reparación y, por lo tanto, muchos ciclos de energía para ser reparados.

Brian Minton
fuente
0

Ese estudio de Google es probablemente el mejor que obtendrá para la pregunta de temperatura. Dudo que alguien haya recopilado tantos datos en tantos tipos diferentes de unidades en el mismo entorno.

El refrigerador conduce a NO "fallar más". Si hace demasiado frío , tendrá tasas de falla más altas. Demasiado de algo bueno ... no lo es. El siguiente gráfico a continuación muestra que 3 años después, a más de 45 grados Celsius, su índice de falla es 3 veces mayor de lo que sería 5-10 grados más caliente. El calor y la fricción son MALOS para la maquinaria de movimiento rápido. Eso no va a cambiar.

Sospecho que no hay demasiados estudios sobre el tema porque no es área gris. Por las excelentes razones dadas en otras publicaciones, es simplemente física.

Kara Marfia
fuente
44
No estoy preguntando por la temperatura, estoy preguntando por los ciclos de centrifugado. Y quiero más que un análisis cualitativo que, por lo que sé, podría ser similar a "es más pesado que el aire y no agita sus alas, por lo tanto, no puede volar".
Gilles 'SO- deja de ser malvado'
0

Los datos manejados por los contadores SMART son una buena referencia promedio pronosticada por el fabricante, pero generalmente son anulados por factores externos ... o incluso un tornillo menos apretado en la unidad.

Luego tiene la rotación RAISE / STOP que consume más energía que permanecer girando durante una gran cantidad de segundos, y también consume tiempo (esto varía en gran medida de viejos a nuevos discos duros y de bajo costo a mejores unidades) ... y otros factores. ..

Puede ver una analogía con una lámpara fluorescente ... que consume en el encendido inicial más de varios minutos de funcionamiento ...

Detener el giro solo es productivo si el software del sistema puede permanecer funcionando solo en la memoria / caché durante un largo período, en los sistemas reales (multiprocesos / daemons / services / rx's), esto generalmente solo ocurre si controla / modifica en gran medida su sistema

La calidad de la energía suministrada para el disco es de gran importancia ... y contribuye mucho para un disco en buen estado ...

Lo RAID no está del todo claro ... si queremos tener un segundo / tercer / enésimo disco muy lo ideal debería ser un DISCO ESPEJO activado solo en un intervalo específico que duerma hasta la próxima activación ... deteniendo el giro durante un largo período ...

En mi experiencia, encontré unidades con más de 10 años de edad y funcionando perfectamente y unidades con 1 año y varios problemas (interfaz, rotor principal, accionamiento del brazo y superficies)

, tendría mucho más que decir sobre esto, desde materiales hasta vibraciones, condiciones térmicas, etc., pero para abreviar quiero decir que las propiedades de la superficie magnética también gran jugador en esta ecuación ... y muchas veces son el factor que condiciona la calidad de la HD

ZEE
fuente
1
Si bien es interesante, esto no responde a mi pregunta. Estoy buscando datos cuantitativos (apague su disco si no lo va a usar durante X minutos).
Gilles 'SO- deja de ser malvado'
> Estoy buscando datos cuantitativos (apague su disco si no lo va a usar durante X minutos). ¡Si! Los MythBusters realizaron experimentos para medir la eficiencia de diferentes tipos de luces para calcular el tiempo mínimo que necesitaría estar fuera de la habitación para que sea más eficiente apagar las luces en lugar de dejarlas encendidas. (Resultó que para todos menos el tipo de luz menos eficiente, los humanos serían incapaces de moverse lo suficientemente rápido como para irse y regresar.) También me gustaría un número simple (o forumla) para determinar cuándo es mejor apagar .
Synetech
Sin embargo, tenga en cuenta que ese episodio de Mythbusters se refería a maximizar la eficiencia energética, no a maximizar la vida útil de la bombilla.
David C.