ssd 2 millones de horas mtbf? ¿Cómo se prueba esto?

8

¿Cómo puede este ssd (corsario) tener un tiempo medio antes de la falla de 2000000 horas? la última vez que revisé eso fue en los cientos de años ...

Según la experiencia, incluso con computadoras que no reciben un uso constante, los SSD siempre fallan mucho antes en comparación con las unidades con platos.

Entonces, si sus afirmaciones son realmente ciertas, ¿qué evidencia respalda su afirmación?

Lolorz12
fuente
Normalmente es solo un número para marketing, no es algo que haya sido certificado independientemente y no tienen que respaldarlo con nada. Además, es muy posible que pueda haber un cambio de firmware o algo que provoque la falla de miles de unidades en unas pocas horas. Pero dependiendo del fabricante, los SSD a veces tienen un valor escrito total máximo de bytes especificado (por ejemplo, 75 TB) y esto es más relevante porque excederlo puede anular efectivamente la garantía. Por lo general, sería muy difícil escribir tantos datos en el período de garantía.
James P

Respuestas:

6

MTBF se define como el tiempo transcurrido previsto entre fallas inherentes de un sistema durante la operación.

Literalmente significa "Tiempo medio entre fallas". Adicionalmente...

Como puede ver, MTBF se refiere a la tasa de falla de una unidad durante su vida útil esperada. Esto no significa que una unidad de MTBF de 1.2 millones de horas durará 1.2 millones de horas, y una unidad de MTBF de 1.5 millones de horas durará 1.5 millones de horas (eso es 136 a 171 años por cierto)

Entonces, ¿qué significa SSD MTBF en realidad para mí?

desafortunadamente, la mayoría de los fabricantes no comparten esta información libremente.

¿Qué significa 2,000,000 horas de MTBF para mí?

En un intento de hacer que el ejemplo utilizado en el artículo sea específico para una unidad con un MTBF de 2,000,000 horas. Se realizaron los siguientes cálculos para determinar que una falla ocurriría cada 250 días

2,000,000 / 8 horas al día = 250,000 / 1000 unidades = 250 días.

El artículo originalmente decía que una unidad con un MTBF de 1.5 millones de horas fallaba una vez cada 150 días:

Si la unidad se usa en un promedio de 8 horas al día, se esperaría que una población de 1000 SSD tuviera una falla cada 150 días ...

El artículo continúa indicando que MTBF no es una excelente manera de determinar qué tan confiable será la unidad.

Una mejor manera de tener una idea de cuánto durará realmente un SSD para usted sería considerar la especificación total de bytes escritos, o TBW. Aunque esta es otra cifra de "expectativa general" y no le dice directamente la vida útil de una unidad, le dará una idea de cómo una unidad se compara con otra. Desafortunadamente, no todos los fabricantes dan esta especificación tampoco.

El artículo también continúa explicando cómo se determina normalmente el MTBF.

El estándar JEDEC JESD218A define el método para probar la resistencia de lectura / escritura de un SSD (se requiere registro gratuito para ver), que es la causa principal de la falla del SSD, pero los fabricantes pueden optar por complementar esto con algunas pruebas de falla adicionales.

Otra cosa a considerar es qué carga de trabajo se utiliza para especificar el MTBF. Por ejemplo, Intel califica sus SSD con una carga de trabajo de 20 GB de escrituras por día durante 5 años. Con esta carga de trabajo, junto con las pruebas de falla suplementarias, el Intel 335 tiene un MTBF de 1.2 millones de horas. Sin embargo, si la carga de trabajo se redujera a 10 GB por día, el MTBF sería de 2.5 millones de horas. A 5 GB por día, se convierte en 4 millones de horas.

Referencias

  1. Comprensión de MTBF en SSD: ¿Qué significa para usted un MTBF de SSD? - Hardcoreware.com, Carl Nelson, 6 de enero de 2013
Ramhound
fuente
interesante, sería bueno saber un poco más de las compañías que enumeran estas cosas qué tipo de pruebas usan para obtener algunos de estos números. de todos modos con respecto a mi fuente comentar que el lugar donde trabajo tiene ~ 100 computadoras y solo 8 computadoras de escritorio usan SSD mientras que todas usan bandejas. hemos tenido una mayor tasa de fallas entre los SSD que los platos (3-4 SSD en los últimos dos años frente a ~ 7 mecánicos)
Lolorz12
1
He eliminado mis comentarios dirigidos a @qasdfdsaq ya que he abordado sus preocupaciones. Solo estoy tratando de limpiar la sección de comentarios para esta respuesta. No estoy tratando de ocultar nada eliminando esos comentarios, simplemente no son relevantes, si he abordado sus preocupaciones sobre el material original.
Ramhound
@qasdfdsaq - Todavía no sé cuál es su problema con mi respuesta. No hay una sola palabra citada que haya cambiado.
Ramhound
He resaltado en negrita los términos incorrectos que ha utilizado y lo he señalado varias veces. Una vez más, si no puede entender la diferencia, entonces no tiene conocimiento de MTBF.
qasdfdsaq
1
Solo para tener en cuenta: la respuesta me parece bien, pero los comentarios parecen acalorados. Estoy limpiando ambos lados de esto. Notaría que la mejor manera de lidiar con una respuesta que considera incorrecta es publicar una respuesta mejor.
Journeyman Geek
2

Las unidades no fallan exactamente en el momento MTBF: más bien, los momentos en que fallan obedecen a una distribución estadística particular con la media dada. No es necesario que realice la prueba durante el tiempo que la media alcance límites en la media, ya que la prueba por un tiempo más corto aún puede brindarle mucha información sobre la forma de la distribución.

Por ejemplo, suponga que desea demostrar que el MTBF es mayor a un mes. Si el MTBF fue solo un mes, esperaría que algunas unidades fallaran muy rápidamente, por lo que si probó un montón de unidades durante una semana y ninguna de ellas falló en ese momento, tiene motivos razonables para creer que el MTBF es bastante Mucho más de una semana. Si prueba suficientes unidades para el tiempo T, puede argumentar que el MTBF debe tener al menos un valor mayor.

Además, pueden estar usando un argumento en la línea de "Probamos el disco leyendo y escribiendo 24/7 durante un mes. En realidad, la mayoría de los usuarios solo acceden al disco el 1% del tiempo que la computadora está funcionando, así que la mayoría de los usuarios experimentarán cien veces el MTBF que encontramos en nuestras pruebas ".

Otra técnica que puede usarse es probar en condiciones más duras que el uso real. No sé si esto se usa para hardware, pero se usa para la vida útil de los alimentos. Primero, haces experimentos que muestran, por ejemplo, que tus conservas enlatadas se degradan tres veces más rápido cuando se almacenan a 40 ° C que a 20 ° C. Luego, si todavía son buenos para comer después de cuatro meses de almacenamiento a 40 ° C, deberían ser buenos después de un año a 20 ° C.

David Richerby
fuente
De hecho, el mayor defecto en número MTBF es que casi siempre se estiman a partir de muestras de las unidades probadas bajo realista, acelerada condiciones de envejecimiento - altas temperaturas, cargas elevadas, los ciclos de potencia en exceso, etc.
qasdfdsaq