Hace unos años me dijeron que evitara SMART como la peste. El razonamiento fue que el estrés que la prueba ejerce sobre el disco realmente hará que falle.
¿Sigue siendo el caso? Si no, ¿cuál es una frecuencia razonable para ejecutar pruebas? Si todavía debería evitarlo, ¿cuál es una mejor manera de controlar el estado de mis discos duros?
Si bien SMART ciertamente no predice todas las fallas, trabajé en un taller de reparación de computadoras durante varios años, y muchas veces un mensaje de error SMART fue la primera indicación de que iba a ocurrir una falla, lo que me permitió guardar los datos del cliente antes de la unidad murió.
La tecnología en sí misma no hace hincapié en la unidad, solo realiza un seguimiento de una serie de indicadores (lista completa aquí: http://en.wikipedia.org/wiki/SMART .) Que podrían conducir a una falla de la unidad, como:
Leer tasa de error
Cuentan los sectores reasignados
Giro número de reintentos
Recuento de sectores no corregible
Horas de encendido
El impacto en el rendimiento de SMART es insignificante, no hace hincapié en las unidades (el monitoreo es pasivo) y puede potencialmente advertirle que está a punto de perder todas las imágenes de sus hijos (o su colección de MP3 o lo que sea importante en su disco duro) )
Creo que el póster original fue informado sobre el peligro de las pruebas de superficie activas que puede realizar SMART (ejecutando pruebas "largas" manualmente). Bus, como usted dice, por defecto SMART es pasivo y siempre debe estar habilitado. Personalmente, también realizo pruebas activas una vez al mes en mis discos.
Colas Nahaboo
3
Además de registrar pasivamente los contadores y eventos de rendimiento, SMART proporciona una interfaz para iniciar varios tipos de autocomprobaciones realizadas por la unidad y obtener sus resultados más adelante.
Algunas de estas pruebas implican el escaneo de toda la superficie del plato mientras se mantiene en línea y responde a las solicitudes del host, por lo que una E / S pesada causará mucha trilla en la cabeza.
Supongo que esto último es la fuente del grave error que le han dicho. INTELIGENTE es agradable.
Hace un tiempo, Google realizó un estudio (PDF) " Tendencias de fallas en una gran población de unidades de disco ". Tienen toneladas de unidades que usan y el estudio mostró:
Nuestro análisis identifica varios parámetros de la instalación de autocontrol del disco (SMART) que se correlacionan altamente con fallas. A pesar de esta alta correlación, llegamos a la conclusión de que es poco probable que los modelos basados solo en parámetros SMART sean útiles para predecir fallas de unidades individuales. Sorprendentemente, descubrimos que los niveles de temperatura y actividad estaban mucho menos correlacionados con las fallas del disco de lo que se informó anteriormente.
Por lo tanto, la temperatura es un factor mucho mayor que el estrés en el disco. Además, con toda la corrección de errores que ocurre en estas nuevas unidades TODO el tiempo, se agrega mucho más estrés que no tiene control. Si está buscando una herramienta para proporcionar mantenimiento (o recuperación) en sus unidades, recomendaría SpinRite . Es de Steve Gibson y es un producto increíble.
¿Su referencia no dice que la temperatura no está correlacionada con la falla de la unidad? ... ¿pero lo considera un "factor mucho mayor"? Por favor aclare lo que quiere decir
Michael Haren
¿Estoy leyendo eso mal? Dice que la temperatura no está fuertemente correlacionada con la falla de la unidad, ¿verdad? Tampoco es la actividad de acuerdo con ese documento.
MrChrister
1
"Por lo tanto, la temperatura es un factor mucho mayor que el estrés en el disco". - ¿De dónde concluyes eso? El párrafo que citó dijo que la temperatura no estaba tan correlacionada.
Joe Phillips
3
-1 por no leer correctamente el resumen del artículo, sino por no tomarse el tiempo de leerlo todo. La falla de la unidad generalmente se debe a un defecto de fabricación (como se muestra en la Figura 3: el alto uso en los primeros 3 meses elimina los errores de los componentes, después de que la falla debido al uso comienza a converger) o la degradación con el tiempo. La degradación con el tiempo es lo que SMART recogerá. La figura 5 muestra que la temperatura no es un factor importante en absoluto; de hecho, el informe sugiere que las unidades más frías tienen más cambios de falla que las que se calientan, ciertamente dentro de los primeros 3 años.
Además de registrar pasivamente los contadores y eventos de rendimiento, SMART proporciona una interfaz para iniciar varios tipos de autocomprobaciones realizadas por la unidad y obtener sus resultados más adelante.
Algunas de estas pruebas implican el escaneo de toda la superficie del plato mientras se mantiene en línea y responde a las solicitudes del host, por lo que una E / S pesada causará mucha trilla en la cabeza.
Supongo que esto último es la fuente del grave error que le han dicho. INTELIGENTE es agradable.
fuente
Hace un tiempo, Google realizó un estudio (PDF) " Tendencias de fallas en una gran población de unidades de disco ". Tienen toneladas de unidades que usan y el estudio mostró:
Por lo tanto, la temperatura es un factor mucho mayor que el estrés en el disco. Además, con toda la corrección de errores que ocurre en estas nuevas unidades TODO el tiempo, se agrega mucho más estrés que no tiene control. Si está buscando una herramienta para proporcionar mantenimiento (o recuperación) en sus unidades, recomendaría SpinRite . Es de Steve Gibson y es un producto increíble.
fuente