¿Por qué los sectores SSD tienen una resistencia de escritura limitada?

56

A menudo veo que la gente menciona que los sectores SSD tienen un número limitado de escrituras antes de que se estropeen, especialmente cuando se comparan con los discos duros clásicos (disco giratorio) donde la mayoría de ellos fallan debido a fallas mecánicas, no sectores que se deterioran. Tengo curiosidad de por qué es eso.

Estoy buscando una explicación técnica pero orientada al consumidor, es decir, el componente exacto que falla y por qué las escrituras frecuentes afectan la calidad de ese componente, pero se explica de tal manera que no requiere una gran cantidad de conocimiento sobre los SSD.

Nzall
fuente
1
Creo que esta sería una lectura interesante para usted: techreport.com/review/24841/…
MustSeeMelons
44
Esto se basa en el precepto de que hay cosas que puedes usar para siempre y nunca desgastar
azar
1
No olvides la economía actual. Si bien la degradación física es un hecho. Sin duda, es un hecho muy a menudo definido en la etapa del plan con factores importantes como el costo y la obsolescencia planificada.
helena4

Respuestas:

82

Copiado de "Por qué se desgasta el flash y cómo hacerlo durar más" :

NAND flash almacena la información controlando la cantidad de electrones en una región llamada "puerta flotante". Estos electrones cambian las propiedades conductoras de la celda de memoria (el voltaje de puerta necesario para encender y apagar la celda), que a su vez se utiliza para almacenar uno o más bits de datos en la celda. Esta es la razón por la cual la capacidad de la puerta flotante para retener una carga es crítica para la capacidad de la celda de almacenar datos de manera confiable.

Los procesos de escritura y borrado causan desgaste

Cuando se escribe y borra durante el curso normal de uso, la capa de óxido que separa la puerta flotante del sustrato se degrada, lo que reduce su capacidad de mantener una carga durante un período prolongado de tiempo. Cada dispositivo de almacenamiento de estado sólido puede soportar una cantidad finita de degradación antes de que no sea confiable, lo que significa que aún puede funcionar, pero no de manera consistente. El número de escrituras y borrados (ciclos P / E) que puede soportar un dispositivo NAND mientras mantiene una salida constante y predecible, define su resistencia.

Kinnectus
fuente
8
La limitación de los ciclos de escritura flash no es específica para el tipo NAND, pero es cierto para la memoria flash en general. Por ejemplo, en.wikipedia.org/wiki/Flash_memory#Write_endurance
JDługosz
1
@ JDługosz: la memoria flash en general tiene ciclos de escritura limitados, pero el mecanismo real que causa la limitación varía con la tecnología.
Ben Voigt
44
El enlace que publiqué describe el NOR como una "puerta flotante" también. Parece que la celda flash real es la misma , y NAND solo se refiere a la forma en que se conectan en serie (por lo tanto, se parece a una puerta NAND). La lógica de direccionamiento y los detalles de multiplexación son irrelevantes para la mecánica de desgaste del flash propiamente dicho.
JDługosz
2
De hecho, todo flash almacena información como carga en una puerta flotante, esa es básicamente la definición de qué es flash; Existen otros tipos de memoria de solo lectura programable y borrable electrónicamente que flash, y tienen diferentes métodos de degradación, pero flash se define como una EEPROM que almacena información en una carga de puerta flotante. NAND vs NOR define el mecanismo de cómo se leen o escriben los datos, no cómo se almacenan.
Jules
10
Como mínimo, la física es que estás forzando electrones a través de un aislante (muy delgado) aplicando un alto voltaje. Ocasionalmente, esto hará que los enlaces entre los átomos se rompan y se vuelvan a formar en diferentes disposiciones, lo que degradará el aislamiento. Finalmente, la celda de memoria pierde o se corta y ya no puede almacenar datos de manera confiable. La wiki es interesante: en.wikipedia.org/wiki/Flash_memory#Memory_wear . Es posible hacer un ciclo de borrado y reparación en un trozo relativamente grande del chip calentándolo (recocido).
nigel222
64

Imagine un trozo de papel y lápiz normales. Ahora siéntase libre de escribir y borrar tantas veces como desee en un solo lugar en el papel. ¿Cuánto tiempo demora antes de pasar por el periódico?

Los SSD y las unidades flash USB tienen este concepto básico pero a nivel de electrones.

MonoZeus
fuente
35
Me gusta la analogía, pero esta respuesta podría usar algunos hechos para explicar lo que realmente está sucediendo.
GolezTrol
11
No ayuda que se use la misma analogía para DRAM, que tiene un límite superior en muchos órdenes de magnitud en los ciclos de escritura.
Ben Voigt
28
@BenVoigt Ok: DRAM es lápiz + borrador de goma, flash es tinta + borrador de tinta . La tinta es más permanente, a costa de la eliminación que causa más daño. (Oye, eso realmente funciona bastante bien para una analogía ...)
Bob
8
Vale genial. Me estoy imaginando un trozo de papel y un lápiz. Pero una memoria flash no se parece en nada a un trozo de papel y un lápiz, entonces, ¿cómo ayuda eso? También podría decir: "Imagine su automóvil. Si lo conduce lo suficiente, el motor dejará de funcionar". Simplemente dar otro ejemplo de algo que se rompe después de ser usado muchas veces no explica por qué este sistema en particular se rompe después de ser usado muchas veces.
David Richerby
55
@Sahuagin Pero, ¿por qué es así? ¿Por qué no es como una botella de agua que puedo llenar y vaciar tantas veces como quiera sin ninguna erosión medible de la botella? Ese es el problema con esta analogía: me pide que crea que una memoria es como otro sistema, pero el único vínculo entre los dos sistemas es la afirmación de que la analogía funciona.
David Richerby
25

El problema es que el sustrato flash NAND utilizado sufre degradación en cada borrado. El proceso de borrado implica golpear la celda flash con una carga relativamente grande de energía eléctrica , esto hace que la capa de semiconductores en el chip se degrade ligeramente.

Este daño a largo plazo aumenta las tasas de error de bits que pueden corregirse con el software, pero eventualmente las rutinas del código de corrección de errores en el controlador flash no pueden mantenerse al día con estos errores y la celda flash no es confiable.

jcbermu
fuente
1
La limitación de los ciclos de escritura flash no es específica para el tipo NAND, pero es cierto para la memoria flash en general. Por ejemplo, en.wikipedia.org/wiki/Flash_memory#Write_endurance
JDługosz
@ JDługosz: si bien esto es cierto, el hecho de que el flash NOR se pueda borrar y reescribir por palabra en lugar de por bloque significa que la degradación será más lenta en muchos casos, por lo que es cualitativamente diferente, incluso si el mecanismo es lo mismo.
Jules
Es un punto importante que los ciclos de borrado causan desgaste y no los ciclos de escritura. Es posible aprovechar esto para escribir varias veces en una región antes de borrar si sabe que sus cambios son acumulativos (por ejemplo, un mapa de bits de sectores 'en uso' puede acumular muchas escrituras antes de que sea necesario restablecerlo).
Toby Speight
Ejemplo: el reproductor de MP3 para automóvil Empeg (más tarde Rio) almacena la configuración en una ranura de longitud fija; muchos de estos encajan en un bloque de borrado. Al leer, solo recoge el último que tiene una suma de verificación válida. El bloque solo necesita borrarse cuando se han utilizado todas las ranuras dentro del bloque de borrado, en lugar de cada vez que se escribe la configuración.
Toby Speight
11

¡Mi respuesta está tomada de personas con más conocimiento que yo!

Los SSD usan lo que se llama memoria flash. Un proceso físico ocurre cuando los datos se escriben en una celda (los electrones se mueven hacia adentro y hacia afuera). Cuando esto sucede, erosiona la estructura física. Este proceso es muy parecido a la erosión hídrica; finalmente es demasiado y el muro cede. Cuando esto sucede, la celda queda inútil.

Otra forma es que estos electrones pueden "atascarse", lo que dificulta la lectura correcta de la célula. La analogía para esto es que mucha gente habla al mismo tiempo, y es difícil escuchar a alguien. Puede elegir una voz, ¡pero puede ser la incorrecta!

Los SSD intentan distribuir la carga de manera uniforme entre las celdas en uso para que se desgasten de manera uniforme. Finalmente, una celda morirá y se marcará como no disponible. Los SSD tienen un área de "celdas sobre aprovisionadas", es decir, celdas de repuesto (piense en sustitutos en el deporte). Cuando una célula muere, se usa uno de estos. Finalmente, todas estas células adicionales también se usan y la SSD se volverá lentamente ilegible.

¡Esperemos que haya sido una respuesta amigable para el consumidor!

Editar: fuente aquí

Lister
fuente
10

Casi todos los SSD de los consumidores usan una tecnología de memoria llamada memoria flash NAND. El límite de resistencia de escritura se debe a la forma en que funciona la memoria flash.

En pocas palabras, la memoria flash funciona almacenando electrones dentro de una barrera aislante. Leer una celda de memoria flash implica verificar su nivel de carga, por lo que para retener los datos almacenados, la carga de electrones debe permanecer estable con el tiempo. Para aumentar la densidad de almacenamiento y reducir el costo, la mayoría de los SSD usan memoria flash que distingue entre no solo dos niveles de carga posibles (un bit por celda, SLC), sino cuatro (dos bits por celda, MLC), ocho (tres bits por celda, TLC ), o incluso 16 (cuatro bits por celda, TLC).

Escribir en la memoria flash requiere conducir un voltaje elevado para mover los electrones a través del aislante, un proceso que gradualmente lo desgasta. A medida que el aislamiento se desgasta, la célula es menos capaz de mantener estable su carga de electrones, lo que eventualmente hace que la célula no conserve los datos. Con TLC y particularmente QLC NAND, las células son particularmente sensibles a esta deriva de carga debido a la necesidad de distinguir entre más niveles para almacenar múltiples bits de datos.

Para aumentar aún más la densidad de almacenamiento y reducir los costos, el proceso utilizado para fabricar memoria flash se ha reducido drásticamente, a tan solo 15 nm en la actualidad, y las celdas más pequeñas se desgastan más rápido. Para flash NAND plano (no 3D NAND), esto significa que si bien SLC NAND puede durar decenas o incluso cientos de miles de ciclos de escritura, MLC NAND generalmente es bueno para solo alrededor de 3,000 ciclos y TLC de solo 750 a 1,500 ciclos.

3D NAND, que apila las celdas NAND una encima de otra, puede lograr una mayor densidad de almacenamiento sin tener que reducir las celdas como pequeñas, lo que permite una mayor resistencia de escritura. Si bien Samsung ha vuelto a un proceso de 40 nm para su NAND 3D, otros fabricantes de memoria flash como Micron han decidido utilizar procesos pequeños de todos modos (aunque no tan pequeños como el NAND plano) para ofrecer una densidad de almacenamiento máxima y un costo mínimo. Las clasificaciones de resistencia típicas para 3D TLC NAND son de aproximadamente 2,000 a 3,000 ciclos, pero pueden ser más altas en dispositivos de clase empresarial. 3D QLC NAND generalmente tiene una clasificación de aproximadamente 1000 ciclos

Una tecnología de memoria emergente llamada 3D XPoint, desarrollada por Intel y Micron, utiliza un enfoque completamente diferente para almacenar datos que no está sujeto a las limitaciones de resistencia de la memoria flash. 3D XPoint también es mucho más rápido que la memoria flash, lo suficientemente rápido como para reemplazar potencialmente DRAM como memoria del sistema. Intel venderá dispositivos con tecnología 3D XPoint con la marca Optane, mientras que Micron comercializará dispositivos 3D XPoint con la marca QuantX. Los SSD de consumo con esta tecnología pueden llegar al mercado tan pronto como 2017, aunque creo que por razones de costo, 3D NAND (principalmente de la variedad TLC) será la forma dominante de almacenamiento masivo durante los próximos años.

bwDraco
fuente
5

Una celda flash almacena electricidad estática . Es exactamente el mismo tipo de carga que puede almacenar en un globo inflado: coloca algunos electrones adicionales en él .

Lo especial de la electricidad estática es que se mantiene en su lugar . Normalmente en electrónica, todo está conectado a todo lo demás de alguna manera con conductores, e incluso si hay una gran resistencia entre un globo y tierra, la carga se desvanecerá bastante rápido . La razón por la que un globo permanece cargado es que el aire es en realidad un aislante: tiene una resistividad infinita .

Normalmente eso es. Dado que toda la materia consiste en electrones y átomos de átomos, puede hacer que cualquier cosa sea un conductor: simplemente aplique suficiente energía, y algunos de los electrones se sacudirán y serán (por un corto tiempo) libres de moverse más cerca del globo, o más lejos de eso. Esto realmente sucede en el aire con electricidad estática: ¡conocemos este proceso como un rayo !

No tengo que enfatizar que los rayos son un proceso bastante violento. Estos electrones son una parte crucial de la estructura química de la materia. En el caso del aire, los rayos dejan un poco de oxígeno y nitrógeno transformados en ozono y dióxido de nitrógeno. Solo porque el aire sigue moviéndose y mezclándose y esas sustancias finalmente reaccionan al oxígeno y al nitrógeno, no se hace el "daño persistente", y el aire sigue siendo un aislante.

No es así en el caso de una celda flash: aquí, el aislante debe ser mucho más compacto. Esto solo es factible con capas de óxido de estado sólido. Material resistente, pero tampoco es impermeable a los efectos de forzar cierta carga a través del material conductor. Y eso es lo que finalmente destruye una celda flash, si cambia su estado con demasiada frecuencia.

Por el contrario, una celda DRAM no tiene aislantes adecuados. Es por eso que debe actualizarse periódicamente, muchas veces por segundo, para no perder información; sin embargo, debido a que todo es solo transporte de carga conductiva ordinaria, no sucede nada malo si cambia el estado de una celda RAM. Por lo tanto, la RAM soporta muchos más ciclos de lectura / escritura que la memoria flash.


O, para una carga positiva, eliminas algunos electrones de los enlaces de la molécula. Debe tomar tan pocos que esto no afecte la estructura química de manera detectable.

Estas cargas estáticas son realmente pequeñas . ¡Incluso la batería de reloj más pequeña que dura años proporciona suficiente carga cada segundo para cargar cientos de globos! Simplemente no tiene suficiente voltaje para atravesar ninguna barrera potencial notable.

Al menos, toda la materia en la tierra ... no compliquemos las cosas yendo a las estrellas de neutrones.

a la izquierda
fuente
1

Menos técnico, y una respuesta a lo que creo que OP quiere decir con "A menudo veo que las personas mencionan que las SSD tienen una cantidad limitada de escrituras en sus sectores antes de que se estropeen, especialmente en comparación con los discos duros de disco giratorio clásicos, donde la mayoría de las unidades fallan debido a falla mecánica, no sectores que van mal ".
Interpretaré la pregunta de OP como: "Dado que los SSD fallan con mucha más frecuencia que el óxido giratorio, ¿cómo puede el uso de uno dar una fiabilidad razonable?"

Hay dos tipos de confiabilidad y falla. Una es que la cosa falla completamente debido a la edad, la calidad, el abuso, etc. O puede tener un error de sector debido a la gran cantidad de lectura / escritura.

Los errores del sector ocurren en todos los medios. El controlador de la unidad (SSD o spinning) reasignará los datos de un sector defectuoso a un nuevo sector. Si ha fallado por completo, aún puede reasignarse, pero los datos se pierden. En SSD, el sector es grande y a menudo falla por completo.

Los SSD pueden tener uno o ambos tipos de confiabilidad. Los problemas del ciclo de lectura / escritura se pueden ayudar con
un disco más grande. Si tiene una unidad pequeña y la utiliza para sistemas operativos como Windows, obtendrá muchos ciclos de lectura / escritura. El mismo sistema operativo en una unidad de capacidad mucho mayor tendrá menos ciclos. Por lo tanto, incluso una unidad con "solo" unos pocos miles de ciclos podría no ser un problema si cada sector no se borra con frecuencia.
Equilibrio de datos: los SSD moverán los datos de los sectores de uso frecuente a los de uso menos frecuente. Piense nuevamente en el sistema operativo y las actualizaciones, en comparación con una foto que tomó y que solo desea conservar. En algún momento, el SSD podría intercambiar las ubicaciones físicas de la foto y un archivo del sistema operativo para equilibrar los ciclos.
Compresión: comprimir datos requiere menos espacio, por lo tanto, menos escritura.

Luego está la calidad de los componentes. Obtener el SSD o USB más barato que pueda encontrar podría funcionar por un tiempo, pero uno de calidad hecho para uso empresarial durará mucho más tiempo, no solo en ciclos de borrado sino en uso total.

A medida que las unidades se hacen cada vez más grandes (como 100-1000GB), los ciclos de borrado se vuelven menos problemáticos a pesar de que pueden soportar menos escrituras. Algunas unidades usarán DRAM como caché para ayudar a reducir los ciclos de escritura. Algunos usarán un segmento de alta calidad del SSD para caché y una calidad inferior para bajo costo y gran tamaño.

Los SSD de consumo modernos de buena calidad pueden durar mucho tiempo en una máquina de consumo. Tengo más de 5 años que todavía funcionan. También tengo un par de nuevos y baratos que fallaron después de unos meses. A veces es solo (mala) suerte.

MikeP
fuente
Un par de puntos menores para considerar aclarar: 1) Tamaño del sector en el tercer párrafo: en cualquiera de los medios, puede ser un área muy pequeña de falla real. La unidad funciona en unidades de tamaño fijo, por lo que no importa cuán pequeña sea la falla, todavía se bloquea y se asigna en función de la unidad más pequeña con la que se ocupa. 2) Número de ciclos frente al tamaño de la unidad en el cuarto párrafo: el número de ciclos es el mismo independientemente del tamaño de la unidad. Estás hablando de la necesidad potencial de reutilizar más bloques si la cantidad de datos es grande en relación con el tamaño de la unidad. (continuación)
fixer1234
En general, su respuesta se centra más en cómo se tratan las escrituras limitadas y qué tan importante es el problema que la pregunta real de qué causa la cantidad limitada de escrituras.
Fixer1234