¿Cuáles son los puntos principales para evitar RAID5 con SSD?

16

Tengo entendido que un SSD tiene una cantidad limitada de escrituras. RAID5 realiza muchas escrituras debido a la información de paridad en las unidades. Por lo tanto, el razonamiento indica que RAID5 mataría y reduciría el rendimiento de las unidades de estado sólido a un ritmo más rápido.

La siguiente declaración de este artículo me hace pensar que no entiendo completamente o que podría ser incorrecto con mi razonamiento anterior.

Otro nicho para los SSD de alta resistencia son las matrices RAID de paridad. SLC, debido a su latencia de escritura y resistencia inherentemente superiores, es muy adecuado para este tipo de aplicación.

Damainman
fuente
1
Debes recordar cuántas escrituras se necesitan para matar un SSD ... Algo así como 1 o 1,5 millones para SSD de grado de consumidor.
Chad Harrison
@ Hydroparadise Los SSD de grado de consumo actual (junio de 2013, MLC de 20 nm) tienen una calificación de flash de alrededor de 3000 ciclos de escritura / borrado. No dejan de funcionar inmediatamente después de 3000 escrituras completas, pero fallarán mucho antes de un millón de escrituras.
Daniel Lawson

Respuestas:

11

Su razonamiento es correcto, aunque le falta la escala del problema.

Los SSD empresariales se están fabricando con células MLC de mayor resistencia y pueden tolerar tasas de escritura muy altas. SLC todavía elimina el MLC de alta resistencia del agua, pero en la mayoría de los casos, la resistencia de escritura de por vida de HE-MLC excede la vida útil operativa esperada de un SSD.

En estos días, la resistencia se incluye como "Escritos de por vida" en las hojas de especificaciones.

Como ejemplo de esto, la línea Seagate 600 Pro SSD tiene una lista de esto, aproximadamente:

Model   Endurance
100GB       220TB
200GB       520TB
400GB      1080TB

Dada una vida operativa de 5 años, para alcanzar la resistencia indicada para esa unidad de 100 GB, debe escribir 123 GB en esa unidad por día. Eso puede ser muy poco para usted, por lo que hay unidades de mayor resistencia en el mercado. Stec, proveedor OEM para ciertos proveedores de primer nivel, tiene unidades listadas para "10x escrituras de unidad completa durante 5 años". Todos estos son dispositivos eMLC.

Sí, R5 incurre en una amplificación de escritura. Sin embargo, no importa en la mayoría de los casos de uso.


Aquí también hay otro problema. Los SSD pueden tomar escrituras (y lecturas) tan rápido que el cuello de botella de E / S se traslada al controlador RAID. Este ya era el caso de las unidades de metal giratorio, pero se pone de manifiesto cuando se trata de SSD. El cálculo de paridad es costoso, y tendrá dificultades para obtener su rendimiento de E / S de un R5 LUN creado con SSD.

sysadmin1138
fuente
¿Qué son SLC, MLC, HE-MLC y eMLC?
mdpc
1
Gracias por el ejemplo y el razonamiento. Tiene sentido. Mi jefe sigue diciéndome que nunca use RAID5 con SSD, sino RAID0, RAID1 o RAID10. Simplemente no entiendo lo suficiente como para debatir adecuadamente.
Damainman
1
@Damainman La razón principal para no usar R5 con SSD es que dejas mucho rendimiento en el piso cuando haces eso. No se debe a que las cosas se desgasten más rápido (más).
sysadmin1138
1
Además, no use RAID0 si le interesan sus datos. Los SSD no fallan tan a menudo como la oxidación, pero sí fallan. El modo de falla más común en SSD que he visto es la falla completa del controlador de una forma u otra, lo que significa una pérdida total: su RAID0 ahora está roto.
Daniel Lawson
2
Si le interesan sus datos, haga una copia de seguridad. RAID solo está ahí para mantener todo funcionando durante una falla del disco.
John Hunt
9

Encontré 2 trabajos de investigación sobre este tema:

  1. La actualización de paridad aumenta la carga de trabajo de escritura y la utilización del espacio

    Introducción

    [...] Los resultados de nuestro modelo analítico muestran que RAID5 es menos confiable que las bandas con una pequeña cantidad de dispositivos debido a la amplificación de escritura.

    Conclusión

    [...] Se exploran diferentes factores como la cantidad de dispositivos y la cantidad de datos, y los resultados implican que RAID5 no es universalmente beneficioso para mejorar la confiabilidad de los sistemas basados ​​en SSD

    Fuente: No permita que RAID asalte la vida
    útil de su matriz SSD (publicado el 02/2012)

  2. El envejecimiento igual de todos los SSD impone el riesgo de fallas simultáneas (¡RAID1 y RAID6 también se ven afectados!)

    Resumen

    [...] Las soluciones de redundancia, como RAID, pueden utilizarse potencialmente para proteger contra la alta tasa de error de bit (BER) de los SSD antiguos. Desafortunadamente, tales soluciones desgastan dispositivos redundantes a tasas similares, induciendo fallas correlacionadas a medida que las matrices envejecen al unísono. [...]

    5. Resultados de la simulación

    [...] RAID-5 convencional hace que todos los SSD envejezcan de forma bloqueada, y RAID-4 convencional lo hace con los dispositivos de datos; Como resultado, la probabilidad de pérdida de datos en una falla de SSD sube a casi 1 para ambas soluciones a medida que la matriz envejece, y se restablece periódicamente a casi cero cuando todas las SSD se reemplazan simultáneamente. [...]

    Fuente: RAID diferencial: replanteamiento de RAID para la confiabilidad de SSD
    (publicado el 03/2012)

    Para protegerse de esto, el documento propone un nuevo nivel de RAID llamado Diff-RAID que hace una mezcla aleatoria automática en función de la edad en los reemplazos de dispositivos).

    Puede protegerse de esto verificando manualmente el indicador de desgaste del SSD y reemplazando las unidades de manera proactiva con discos de repuesto para que en ningún momento varios discos tengan la misma edad crítica.

TegtmeierDE
fuente
1
Guau. Esa es una lata de gusanos.
Patrick
7

La RAID de paridad afectará su SSD SATA de escritorio de $ 300. Ni siquiera afectará a un SSD de grado empresarial de $ 3000.

Se trata de lo que está comprando y cuál es su caso de uso. SSD es una tecnología mucho más madura de lo que solía ser. En el extremo superior, sus escrituras MTBF y max se están acercando al mismo tipo de confiabilidad que los HDD mecánicos.

Una razón por la que es posible que no desee utilizar RAID de paridad en SSD es que puede saturar rápidamente un plano posterior o un bus controlador con un gran grupo RAID SSD de muchos miembros. Hay rendimientos decrecientes muy rápidamente con la velocidad de lectura de los SSD de gama alta y el ancho de banda del bus / backplane de los controladores RAID actuales. Sin mencionar que si se trata de datos de alojamiento que se distribuyen a través de la red, es muy posible que sus interfaces de red sean el cuello de botella antes del E / S del disco cuando habla de RAID SSD grandes.

Básicamente, escribir de por vida no es un gran problema a menos que esté construyendo su "servidor" de Newegg, pero hay algunas otras razones por las que puede estar desperdiciando dinero poniendo SSD en conjuntos RAID de gran paridad.

MDMarra
fuente
3
Es bastante fácil alcanzar cuellos de botella de rendimiento secuencial sin procesar cuando se usan SSD, incluso en controladores RAID de última generación. Sin embargo, es mucho más difícil alcanzar cuellos de botella aleatorios de E / S. Incluso si no puede saturar todos sus SSD secuencialmente, seguirá obteniendo un mayor rendimiento en cargas de trabajo aleatorias.
Daniel Lawson
1
@MDMarra gracias por la respuesta, hice un voto positivo en su respuesta debido a los detalles proporcionados :).
Damainman