¿Por qué fallan los discos duros?

8

Estoy bastante interesado en las razones por las que ocurren fallas en el disco duro. Algunas personas dicen que es porque se manejó mal durante los procesos de envío y transporte, mientras que otras dicen que se debe al calor / uso intenso prolongado, sin embargo, incluso he escuchado a alguien decir que se debe al polvo.

¿Cuál es la respuesta más probable y la causa de las fallas del disco duro?

JFW
fuente

Respuestas:

9

Hay un buen resumen aquí .

Las razones incluyen:

  • Choque de cabeza, donde la cabeza de lectura y escritura toca un plato.
  • Filtro de aire defectuoso, que permite que el polvo caiga en el plato
  • Fallo real de la electrónica del controlador.
  • Falla mecánica o piezas desgastadas

Por lo tanto, ser golpeado durante el envío es una posible razón para fallas en el disco, y el uso prolongado en condiciones intensas provocará el desgaste de las piezas mecánicas y la entrada de polvo también puede causar una falla.

La causa más probable de una falla del disco si el disco no está defectuoso de alguna manera es simplemente desgastarse.

Richard Holloway
fuente
7

Algunas causas de falla del disco duro incluyen:

  • mal manejo, por ejemplo, impacto, electricidad estática
  • vibración
  • alta aceleración
  • sobretensión / sobretensión
  • polvo u otra materia particular, p. ej. limaduras de metal
  • cambios rápidos de temperatura, creo que EMC dice que hay un cambio de temperatura de más de 10 ° C por hora, pero consulte con su proveedor
  • alta temperatura normal, p. ej., temperatura ambiente superior a 45 ° C o más, consulte con su proveedor
  • en los viejos tiempos, los controladores defectuosos, pero hoy en día creo que el firmware / enclavamientos físicos tienden a evitar eso, aunque creo que ocasionalmente se ha lanzado un firmware defectuoso que ha causado problemas de falla de la unidad.
  • componentes defectuosos / otro defecto de fabricación

Puede encontrar este documento interesante: http://labs.google.com/papers/disk_failures.pdf Básicamente, algunos Google Sysadmin / SRE investigaron algunas fallas de unidades en una gran población de unidades (es decir, los centros de datos de Google).

Jason Tan
fuente
Me sorprendió saber que, aparentemente, una unidad más fría (más fría que 37 'C) durará más que una unidad más caliente, según ese documento .
David Cary
1

Firmware con errores: sí, como los velociraptors. ser mordido por esa estupidez en este momento. Tiene que cambiar el firmware en una docena de unidades.

TomTom
fuente
Tengo un montón de unidades WD que no se activarán a menos que estén conectadas al modelo de controlador específico que las configuró para esperar / no activar la energía. WD los reemplazará porque aparentemente fue un error en el firmware del disco, ¿síndrome de Estocolmo? ^^
Oskar Duveborn
No estoy seguro. Estúpidos velociraptors se apagan cada 49.x días durante algunos segundos: mi controlador RAID los odia. Solucionado hace mucho tiempo. Obtener la actualización de WD fue peor que recibir una extracción. Tuvimos que conseguir abogados en el enlace antes de que admitieran que existía la solución.
TomTom