Cómo restablecer resultados SMART

16

¿Cómo puedo restablecer los resultados SMART para que no registre resultados anteriores? Mi razón es que estaba probando los discos duros cerrados juntos en un caso cerrado. Esto hizo que uno de los HDD fallara la lectura de temperatura del flujo de aire.

Después de abrir la carcasa (lo que redujo la temperatura de todas las unidades 10 grados Celsius en 5 minutos) y luego separar las unidades un poco más (3 grados menos) Todos los resultados fueron buenos, pero dado que la lectura del flujo de aire falló en una lectura anterior, siempre muestra como fallando.

Entonces, ¿cómo puedo restablecer las lecturas de SMART?

ingrese la descripción de la imagen aquí

Luis Alvarado
fuente
1
Creo que puede usar Mhdd para apagar de manera inteligente. Es con las herramientas de disquete en sysresccd.org/System-tools, no es la mejor idea ... pero podría valer la pena analizarlo.
Mateo
2
¿Por qué quieres restablecerlo?
Angelo
Bueno, básicamente fue hace 3 años, pero creo que fue porque, en ese momento, el HDD estaba en un lugar que tenía MUCHO calor externo. Después de trasladarlo a una habitación con un clima más frío, el problema persistió, aunque la temperatura pasó de 68 grados a 37 grados. Entonces, el problema fue un aumento de la temperatura externa que creó el problema al principio, pero aún se mostraba después de trasladarlo a otro lugar.
Luis Alvarado

Respuestas:

0

Los discos duros tienen espacio libre por razones de recuperación. La recuperación ocurre automáticamente. Las herramientas de recuperación solo reasignan sectores físicamente defectuosos a este espacio libre. Una vez reasignado, cuando se produce una lectura o escritura en un sector defectuoso, la unidad gira el acceso al espacio libre y oculta el error.

Para ser honesto, no conozco una manera de restablecer los datos SMART. Es algo que el disco duro mantiene internamente y, en cualquier caso, sería algo malo.

¡SMART informa que su disco duro está fallando! Restablecer los contadores no cambiará el hecho de que se haya excedido un umbral de error para la unidad.

Entonces NO, no puede restablecer el historial SMART. Se instala en la fábrica para la evaluación de la unidad en caso de falla. SMART solo se puede deshabilitar o habilitar.

Espero que esto responda tu pregunta.

Mitch
fuente
Hola Mitch, como se explica en la pregunta, el fracaso no es real. Fue porque todos los HDD se pusieron muy cerrados en un espacio pobremente ventilado. Después de cambiar eso y probar nuevamente, funcionaba perfectamente, excepto que todavía mencionaba el fracaso pasado. Por el momento hice el siguiente sudo smartctl -l sataphy, reset / dev / sdd que resolvió el problema de la Evaluación general teniendo en cuenta la falla anterior que ahora parece normal, pero la falla aún aparece para el atributo específico. Nuevamente, el HDD en realidad no está fallando, pero el error anterior aún se muestra.
Luis Alvarado
Entiendo, pero puede parecer normal, solo está oculto. Usted preguntó si eso se puede restablecer, y la respuesta es NO. Aunque pudo ocultar el error, una vez que la unidad va al fabricante por cualquier motivo, pueden descubrir qué fue lo que realmente salió mal con la unidad con el tiempo. Todo lo que digo es que aún se muestra el error anterior, y a menos que pueda tener en sus manos las herramientas utilizadas por los fabricantes, para descansar el estado INTELIGENTE de la unidad, todavía se mostrará.
Mitch
26

En realidad, hay una manera de restablecer los datos SMART. Solo necesita un simple convertidor rs232 a usb (uart a ttl) y algunos cables conectados a las interfaces de diagnóstico de discos duros. (está en el lado derecho del puerto sata, 5 o 4 pines) Debe conectar los cables RX TX y GND (y el cable de alimentación, por supuesto: D), luego encender el HDD y conectarlo con masilla o hiperterminal (Linux puede conectarse con su propio terminal, supongo), por ejemplo, para unidades Seagate: para 7200.10 y anterior, la velocidad en baudios es 9600 para 7200.11 y la más nueva es 38400

comandos después de la conexión presione CTRL + Z y luego escriba "/ 1" presione enter escriba "N1" presione enter cuando termine de quitar todos los cables y encienda el HDD como de costumbre para ver los cambios :)

para otra información de disco duro use google :)

SR. X
fuente
55
Esto solo parece aplicarse a las unidades Seagate, pero tiene razón, este video explica el proceso.
Adrian Frühwirth
55
Uno de mis compañeros de trabajo contactó a Seagate, y nos dijeron que desde entonces habían bloqueado esta función para que no se pueda acceder sin una herramienta patentada. No estoy seguro de en qué momento hicieron esto.
JFA
4

Los datos SMART no son muy estándar entre los fabricantes, pero la prueba de temperatura del disco duro debe indicar si la temperatura del disco ha superado un umbral en el pasado: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

La idea es que un sobrecalentamiento aumenta sus posibilidades de fracaso. SMART no está diciendo que su unidad es mala, pero tiene una mayor probabilidad de falla en el futuro.

SMART está destinado a ser una auditoría del historial de las unidades y es mantenido por la propia unidad, por lo que no puede "restablecer" o "borrar" los valores SMART.

Ligeramente Cubano
fuente
3

El punto de los atributos actuales / peores, como la temperatura, es exactamente esto: para decirle si la unidad ha estado alguna vez fuera de su temperatura máxima de funcionamiento y, por lo tanto, podría haber sufrido daños permanentes.

Es por eso que dice "falló en el pasado", no "falla ahora": apenas tocaste el umbral de temperatura máxima. Tenga en cuenta que la pantalla de atributos muestra "normalizado: 50, umbral: 45, peor: 45". (Estos son 0..200 valores normalizados como para cualquier otro atributo, no temperaturas Celsius sin procesar).

También tiene algunos sectores defectuosos (errores de sector no corregibles), por lo tanto, ya sea que la breve temperatura alta lo haya causado o no, probablemente sea hora de deshacerse de esa unidad.

Una mejor interfaz de usuario de software SMART le mostrará la temperatura actual y máxima . por ejemplo,
smartctl -a /dev/sdao smartctl -x /dev/sda( -ximprime todos los datos SMART y no SMART disponibles que puede obtener del disco, incluido un registro del historial de temperatura si el disco tiene uno, con un gráfico de barras ASCII).

smartctl -x incluye esto para un viejo disco duro WD Green de 1TB (WD10EADS):

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

Parece que el software que está utilizando solo muestra la temperatura actual, que está ligeramente por debajo del umbral, pero no ocultará el hecho de que la unidad estaba fuera de especificaciones en algún momento en el pasado.


Ciertamente podría justificar ignorar esa alta temperatura momentánea, si realmente la corrigió en minutos. Pero nunca (o no debería) ser capaz de hacer que la unidad en sí mienta sobre el hecho de que superó su temperatura máxima nominal durante algún tiempo y, por lo tanto, el atributo falló en el pasado.

Puede configurar smartdpara ignorar cualquier atributo dado para que aún pueda recibir una notificación útil si cualquier otra cosa cruza un umbral en territorio oficialmente defectuoso. : smartd.conf(5)dice:

-i ID [ATA only]Ignore la ID del número de atributo del dispositivo cuando verifique la falla de los atributos de uso. ID debe ser un número entero decimal en el rango de 1 a 255. Esta Directiva modifica el comportamiento de la Directiva '-f' y no tiene ningún efecto sin ella.

Esto es útil, por ejemplo, si tiene un disco muy antiguo y no desea seguir recibiendo mensajes sobre el error del atributo de horas de vida (generalmente el atributo 9). Esta directiva puede aparecer varias veces para un solo dispositivo, si desea ignorar múltiples atributos.


Atributos de historial de temperatura extendidos

Acabo de recibir un nuevo Seagate Barracuda de 6 TB (ST6000DM003-2CY186 firmware 0001, una unidad de 5425 RPM), que tiene algunas estadísticas interesantes, que incluyen el tiempo invertido que excede los puntos operativos mínimos / máximos, y altas / bajas de temperaturas a corto plazo y a corto plazo .

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

Y en la sección de detalles completos:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(La unidad solo ha estado encendida durante un par de minutos; presumiblemente es por eso que no -hay datos en algunos de los campos).

Si conduce tiene estos atributos extendidos, puede mostrarle a alguien que el tiempo que pasó fuera de la temperatura permitida fue muy corto (si ese es el caso). Presumiblemente, si fuera a modificar los datos SMART, simplemente lo habría hecho y habría eliminado cualquier mención de que esté fuera del rango, pero obviamente no puede confiar al 100% en ningún dato de un disco de segunda mano que Alguien intenta venderte.

Consulte /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist para obtener más información sobre las unidades usadas con "reversión del odómetro" en su atributo "Power_On_Hours", por ejemplo.

Peter Cordes
fuente
Gracias Peter por el análisis exhaustivo aquí. Apreciado enormemente.
Luis Alvarado
0

Que yo sepa, la única forma de detenerlo es desactivar SMART en el BIOS. Sin embargo, esto solo detendrá el HARDWARE.

Su sistema operativo seguirá consultando la unidad para obtener información SMART y le dirá que está fallando.

Jesseryte
fuente