¿Cómo verifico el estado de un SSD?

81

Todos sabemos que los SSD tienen una vida útil predeterminada limitada. Entonces, la pregunta para mí es ¿cómo verifico (Ubuntu) Linux cuál es el estado actual de mi SSD? ¿Y tal vez una estimación de cuánto tiempo llevará?

Se prefiere la herramienta gráfica, pero la herramienta de línea de comando también estaría bien.

Estoy usando Xubuntu 12.04 LTS

keiki
fuente
1
¿Puedes agregar el resultado de smartctl -i /dev/sdatu pregunta?
Mitch
1
@ dschinn1001 No exactamente, eso solo se aplica a los SSD recientes. Se sabe que los SSD de primera y segunda generación tienen una vida útil limitada de acuerdo con la cantidad de operaciones de escritura en el disco.
João André
1
Al provenir de unidades giratorias de la vieja escuela, utilicé herramientas para probar HD que escribieron y leyeron todo el disco varias veces, lo que tomó algunas horas. ¿Parece que ninguna de las herramientas mencionadas usa tal enfoque? ¿Este enfoque no tiene sentido para SSD? Bueno, entonces parece que el SSD registra sus propias experiencias, y luego puede saber si está enfermo. ¿He entendido esto correctamente?
Mads Skjern
@MadsSkjern Es perfectamente factible usar una herramienta como badblocks para verificar el estado de un SSD. Sin embargo, hay muy buenas razones para NO hacerlo. Los SSD en mi experiencia suelen fallar después de exceder un cierto umbral de escritura, por lo que una prueba destructiva de lectura y escritura como la que se puede realizar badblockspuede acortar la vida útil de la unidad.
Élder Geek

Respuestas:

35

Instale la Utilidad de disco Gnome y verifique los Datos y pruebas SMART para el conteo de nivelación de desgaste o similar. Cuanto mayor sea ese número (%, de 1 a 100), más "agotado" estará su SSD, lo que significa que es más probable que tenga problemas. Pero si tiene un SSD reciente, no necesita preocuparse por ello.

Instalado a través de

 sudo apt-get install gnome-disk-utility

iniciarlo a través de

ya sea menú-> Configuración-> Utilidad de disco

o a través de la línea de comando

sudo gnome-disks
João André
fuente
2
Sí, no estaba seguro sobre el nombre porque lo cambiaron en 12.10
João André
8
palimpsest no es reconocido por Ubuntu 14.04, aunque la utilidad gnome-disk-utility está instalada. Tampoco veo una utilidad de disco en la configuración (icono de engranaje). palimpsestes un nombre horrible, ¿varía el nombre con el idioma del usuario (por ejemplo, inglés versus otra cosa).
Paul
10
como una nota para los lectores; palimpset se renombra a gnome-disks (como se mencionó askubuntu.com/a/623306/4580 ).
immeëmosol
2
¿Por qué dice "Si tiene un SSD reciente, no necesita preocuparse por eso"?
JFA
2
Tienes esto al revés. El número de desgaste comienza en 100 y disminuye con el uso, por lo que cuanto mayor sea el número, MENOS será el SSD, consulte aquí: superuser.com/questions/1037644/…
Logix
48

para verificar el estado de un SSD

Para distribuciones basadas en Ubuntu, Mint o Debian

# apt-get install smartmontools

Media_Wearout_Indicator es lo que estás buscando. Por 100 significa que su SSD tiene 100% de vida, el número más bajo significa que queda menos vida.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Para mostrar su información sdd

# smartctl -a /dev/sda

Puede leer el artículo completo en Nam Huy Linux Blog: cómo verificar la vida útil de SSD que queda en Linux

Blanca Higgins
fuente
1
Entonces, si el mío tiene un valor de 199 a 199, ¿es creíble?
m4tm4t
77
Esa propiedad no aparece en mi SSD. Tal vez debería mirar Wear_Leveling_Count en su lugar? como en: sudo smartctl -a / dev / sda | grep Wear_Leveling_Count EDIT: confirmado por la respuesta a continuación: askubuntu.com/a/381779/221115
Jose Gómez
En Kingston tienesWear_Range_Delta
phreakbox
En KINGSTON SV300S37A240G debe buscarSSD_Life_Left
Herlon Aguiar el
Blanca Higgins, namhuy.net/1024/how-to-check-ssd-life-left.html está muerto.
Sr.zog
35

Si no tiene un SSD de la marca Intel: LEA ESTO.

Cuidado !! - Fui alegremente engañado por 'smartmontools'. Tengo un SSD de Samsung , y la herramienta smartmonitor / 'smartctl' felizmente informó erróneamente que el atributo '233' (hexadecimal 'E9') era 'Media_Wearout_Indicator'; de hecho, no, para Samsung (y otros fabricantes) es completamente diferente. Esta y otras publicaciones en foros, preguntas / respuestas de intercambio de pila y blogs de usuarios avanzados que encontré parecen estar "centrados en Intel", con solo vagas pistas de que "puede variar". (Frente a cualquier sugerencia de que debe tener cuidado con el etiquetado incorrecto y erróneo del atributo por parte de smartmontools).

Mientras me preparaba para copiar mi SSD a un nuevo disco duro que había comprado (debido a lo que Smartmontools me había dicho), inicié Windows (tengo un sistema de arranque dual), para aprender algo sobre SSD de lo que solo Windows La herramienta de Samsung 'Samsung_Magician_v43.exe' tuvo que informarme sobre mi disco, fue sorprendentemente poco informativo.

Después de las horas de excavación, finalmente pude ejecutar las herramientas solo para Windows: hddgaurdian - 'code.google.com/p/hddguardian', y luego también CrystalDiskInfo: ¡Sorpresa! ambas herramientas me dicen independientemente que mi SSD Samsung está "bien" (el guardián del disco duro dice "5 estrellas" y Crystal Disk "98% OK"). Por el contrario, la herramienta smartctl etiquetó explícitamente el atributo con 'decimal-233 /' hex-E9 'como "Indicador de desgaste de medios" - y me dijo que su valor era "1" o 1% - un indicador de (el riesgo de) Fallo pendiente. Para estar lo más seguro posible, cavé y cavé y finalmente pude localizar al menos algo del oficial de Samsung: " http://www.samsung.com/global/business/semiconductor/minisite/SSD/us/download/ 07_Comunicando_Con_Su_SSD.pdf"El documento de hecho implica que el atributo 'hexadecimal E9' / 'decimal' 233 'no es utilizado por Samsung de la misma manera. (Samsung: Estoy muy decepcionado, arregle su herramienta de software oficial, o al menos hágala. claro que no proporciona información de indicación de desgaste!)

Además, si no tiene una SSD Intel ni una SSD Samsung, tenga cuidado, esta información parece variar según los fabricantes. (p. ej., consulte la tabla de etiquetas de atributos en 'code.google.com/p/hddguardian/wiki/about_reliability' para obtener la única indicación útil del grado de variabilidad que encontré).

Lo que sí: si no tiene un SSD Intel, no se deje engañar por las etiquetas de nombre de atributo falsas proporcionadas por smartmonitor. Quizás mejore en el futuro, pero la versión instalada de forma predeterminada para Ubuntu 12.04 LTS (abril de 2014) fue un fracaso total. En lugar de decirte que 'no sabe', smartctl simplemente etiquetó mal el atributo. No encontré otra herramienta para Linux que hiciera que la información 'correcta' fuera transparente o clara.

Matt S.
fuente
1
Consejos para incluir el enlace a la documentación de Samsung de sus atributos SMART. No tengo idea de cuáles son esas otras aplicaciones que mencionó o qué tan útiles son, pero le recomiendo que simplemente vigile el atributo # 5 "Recuento de sectores reasignados", ya que este será un buen indicador de qué tan cerca está su SSD al fracaso, ya que una vez que se queda sin sectores de repuesto que tiene que usar para reemplazar los que van mal, entonces se acercará a EOL en su SSD
Maks
1
El PDF ahora se puede encontrar en samsung.com/global/business/semiconductor/minisite/SSD/M2M/…
Fuerza
10

Para unidades Kingston en computadoras basadas en Debian

Similar a esta respuesta ejecutar

# apt-get install smartmontools

Sin embargo, cuando ejecuto el comando para mostrar la información de la unidad, parece que SMART estaba deshabilitado:

# smartctl -a /dev/sda 
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-45-generic] (local build)
[ ... ]
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

Debe habilitarlo ejecutando lo siguiente como root:

# smartctl -s on -a /dev/sda

Luego puede ejecutar una autocomprobación haciendo una prueba corta (que me llevó aproximadamente 1 minuto):

# smartctl -t short -a /dev/sda

o una prueba más exhaustiva (que me llevó alrededor de 1,5 horas):

# smartctl -t long -a /dev/sda

Tenga en cuenta que, en la mayoría de los casos, no necesita desmontar la unidad para ejecutar estas pruebas. Si lo haces, mira man smartctl.

Ahora, cuando ejecute smartctl -a /dev/sda, debería ver el resultado de la prueba de autoevaluación. Esto es probablemente todo lo que realmente necesita para preocuparse:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Si le gustan los detalles, también verá una tabla como esta:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   095   095   050    Old_age   Always       -       0/178007034
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   092   092   000    Old_age   Always       -       7626h+46m+45.580s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8
171 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       4
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   030   035   000    Old_age   Offline      -       30 (Min/Max 24/35)
194 Temperature_Celsius     0x0022   030   035   000    Old_age   Always       -       30 (Min/Max 24/35)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/178007034
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/178007034
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/178007034
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       3498
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       2885
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       2885
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       868

Si está buscando lo que significan todos estos valores, consulte la documentación de Kingston .

Miguel
fuente
Si vas a votar a favor, al menos deja un comentario ...
Mike
1
No todos los SSD de Kingston los admiten a todos. Algunos que no (como mi UV400 ) parecen mostrar números aleatorios en aquellos campos que no admiten.
otus
a la respuesta le faltan algunos consejos más útiles sobre los detalles inteligentes. Solo para asegurarse de que el lector está leyendo adecuadamente la tabla de valores resultante. En resumen, me parece que el valor SSD_Life_Left es el indicador más directo. Si es 100, SSD nuevo, si es 1, un SSD muerto viviente.
mh-cbon
@ mh-cbon Dado que la respuesta ya es relativamente prolija, simplemente me vinculé a la documentación de Kingston ya que hay MUCHOS detalles allí. Sin embargo, si cree que puede mejorar la respuesta, edítela.
Mike
5

Wear_Leveling_Count es el atributo correcto para rastrear. Sin embargo, al igual que los otros atributos, 100 es el MEJOR valor y 0 es el PEOR. Piense en ello como "porcentaje de vida restante".

Jim Van Zandt
fuente
3
Puede variar de un fabricante a otro, pero lo más probable es que esté muy mal. En esta página que explica los códigos de micras (también conocido como crucial, como en "crucial m4", etc.), este es el "Conteo de borrado promedio de todos los bloques buenos". Ese es un número que aumentará con el uso. Si lee un poco sobre la nivelación del desgaste , se dará cuenta de que debe alcanzar al menos las decenas de miles antes de que la unidad se desactive (es decir, es probable que no viva para verla morir de esta manera).
Ricitos
2
El mío dice 1461.
CMCDragonkai
4

La mejor manera de verificar el estado de un SSD es seguir las recomendaciones del fabricante para hacerlo. Como estos varían de un fabricante a otro y pueden cambiar con el tiempo, es una buena idea consultar con el fabricante de sus unidades si tiene dudas. Según las clasificaciones de MTBF (el estándar JEDEC JESD218A define el método) proporcionado por la mayoría de los fabricantes, un SSD debería durar más de un millón de horas sin problemas.

Tengo varios de estos que cubren varios fabricantes. Puedo garantizar que los atributos SMART varían de un fabricante a otro. Para fines de comparación, aquí hay un ejemplo de OCZ y datos inteligentes de una unidad Corsair F40 junto con una discusión sobre cuán poco confiables son estos datos.

Si bien los datos SMART ciertamente pueden tener valor, ya que todos los dispositivos fallan eventualmente, lo importante es que haga una copia de seguridad de sus datos regularmente. Esto proporciona la tranquilidad de que sus datos están seguros mientras espera (probablemente durante varios años) a que su SSD falle. A medida que los costos bajan y las capacidades aumentan, es más probable que reemplace un SSD debido a restricciones de espacio que a fallas. (En mi experiencia 10 veces más probable). Simplemente haría copias de seguridad regularmente y no me preocuparía.

Fuentes:

Experiencia, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/

Elder Geek
fuente
0

Para (al menos algunas) unidades NVMe, puede hacer

smartctl -a /dev/nvme0

Luego puede buscar una línea como:

Percentage Used:                    5%

Aquí los números más bajos son mejores y 100%significa que el disco está "desgastado". La documentación del fabricante sugiere que es posible obtener números superiores al 100% si sigue utilizando la unidad más allá de este punto ( ejemplo de Seagate, consulte la página 12 ).

Tenga en cuenta que si usa el espacio de nombres o dispositivos de partición, como /dev/nvme0n1o /dev/nvme0n1p1, no funcionará y en su lugar recibirá un mensaje como Read NVMe SMART/Health Information failed: NVMe Status 0x4002.

Nate Eldredge
fuente