Cómo determinar qué tan muerto está un HDD a partir del informe SMARTCTL

11

Hoy recibí un informe aleatorio en una Terminal abierta que decía "¡Mi disco duro está a punto de fallar!"

Hice algunas pruebas y no estoy seguro de lo malo que es esto. La computadora está funcionando bien, pero seguí adelante y empujé todo mi trabajo a github. No quiero seguir trabajando en esta computadora si existe la posibilidad de que se bloquee y lo pierda todo.

El disco es un HDD - Western Digital Caviar SE Serial ATA

¿Cómo debería ser un smartctl normal para una unidad estable?

Atributos INTELIGENTES:

ingrese la descripción de la imagen aquí

La prueba falla:

ingrese la descripción de la imagen aquí

nuevo Objekt
fuente
¿Realmente estás hablando de un SSD? Especialmente Spin_Up_Timeme sorprende en el contexto de los SSD.
mpy
Sí, aparentemente no lo es. Obtuve las letras de la unidad confundidas en ese momento. Tengo más de 5 unidades conectadas a esta máquina y todas tienen tamaños similares.
nuevo Objekt
Actualice su pregunta en consecuencia, luego la respuesta de DavidPostill se ajusta a la pregunta.
mpy
@mpy Hecho. La respuesta de David parece estar bien sin modificaciones.
nuevo Objekt

Respuestas:

11

Hice algunas pruebas y no estoy seguro de lo malo que es

Respuesta corta:

Haga una copia de seguridad de esta unidad y reemplácela de inmediato .

Respuesta larga:

Una compañía llamada Backblaze ha recopilado datos sobre fallas del disco duro. Ha publicado esos datos en los blogs de la compañía, destacando qué unidades del fabricante fallaron con más frecuencia que otras.

En un blog reciente , publicó datos que indican exactamente qué 5 atributos SMART indican una falla inminente de la unidad:

Por experiencia, hemos encontrado las siguientes 5 métricas SMART que indican una falla inminente de la unidad de disco:

  • SMART 5 - Reallocated_Sector_Count.
  • SMART 187 - Reported_Urcorrectable_Errors.
  • SMART 188 - Command_Timeout.
  • SMART 197 - Current_Pending_Sector_Count.
  • SMART 198 - Offline_Irecorrectable.

Elegimos estas 5 estadísticas en base a nuestra experiencia y aportes de otros en la industria porque son consistentes en todos los fabricantes y son buenos predictores de fallas.

El artículo continúa sugiriendo:

SMART 5: Reallocated_Sector_Count
1-4 keep an eye on it, more than 4 replace

SMART 187: Reported_Uncorrect
1 or more replace

SMART 188: Command_Timeout
1-13 keep an eye on it, more than 13 replace

SMART 197: Current_Pending_Sector_Count
1 or more replace

SMART 198: Offline_Uncorrectable
1 or more replace

En su caso 5 (valor bruto 2), 197 (valor bruto 484) y 198 (valor bruto 371) muestran signos de falla.

DavidPostill
fuente