¿Debo evitar poner dos SSD en una configuración RAID1 debido a la degradación del rendimiento?

15

Tengo un sistema de estación de trabajo que tendrá dos SSD industriales de 64 GB, y el plan es tener ambos discos en una configuración RAID1 para la redundancia que se configura en el arranque rápido. El sistema ejecutará CentOS 7. Al investigar esto, descubrí que la Guía de administración de almacenamiento RHEL no recomienda RAID1 para SSD.

Red Hat también advierte que los niveles RAID de software 1, 4, 5 y 6 no se recomiendan para usar en SSD. Durante la etapa de inicialización de estos niveles de RAID, algunas utilidades de administración de RAID (como mdadm) escriben en todos los bloques del dispositivo de almacenamiento para garantizar que las sumas de verificación funcionen correctamente. Esto hará que el rendimiento de la SSD se degrade rápidamente.

¿Es algo de lo que debería preocuparme seriamente? ¿Hay alternativas de redundancia que pueda usar?

De acuerdo con la documentación de RHEL nuevamente, la duplicación LVM ahora aprovecha el RAID del software MD, por lo que la advertencia RAID también se aplica a eso.

Más información: Los SSD son de la serie Swissbit X-200 (SATA), y parece que el sobreaprovisionamiento es del 40%.

El RAID de hardware no será una opción, según el equipo de hardware.

mochatiger
fuente
¿Puedes explicar en qué consiste la aplicación? ¿Está utilizando SSD industriales porque este es un entorno hostil o un sistema controlador de algún tipo?
ewwhite
Sí, las máquinas estarán al aire libre y deberán soportar condiciones ambientales / de temperatura extremas.
mochatiger
2
Si realmente le preocupa, puede usar mdadm -C --assume-clean...para evitar la sincronización inicial. Al menos con RAID-1.
derobert

Respuestas:

10

No recomendaría el software RAID de Linux con SSD, especialmente para el arranque. Tomaría la decisión en función de los posibles escenarios de falla y cuál es el impacto del tiempo de inactividad. Para los SSD industriales, generalmente los he usado de forma independiente, sin RAID.

Si esta estación de trabajo fallara, ¿qué tan rápido puede 1). recuperación de copias de seguridad o 2). reconstrucción / reimagen?

¿Qué tipo de SSD son estos (marca / modelo)? Si se aprovisionan en exceso, esto puede no ser un gran problema. Si son SATA y están conectados a la placa base, tendrá algunas opciones de TRIM.

Puede usar un controlador RAID de hardware LSI de nivel básico para facilitar la implementación y la recuperación. Al menos el RAID subyacente será transparente para el sistema operativo.


Editar:

Estos son SSD industriales altamente sobreaprovisionados . Configure el espejo RAID 1 como normal y simplemente monitoree las unidades a lo largo del tiempo.

ewwhite
fuente
1
Aunque si decide hacer RAID de hardware, debe asegurarse de que el sistema operativo sea compatible con el hardware de modo que pueda ver el estado de los dispositivos subyacentes, o no sabrá cuándo los dispositivos comienzan a fallar a menos que esté físicamente al frente de la máquina. +1 de mi parte, de todos modos.
MadHatter
Todos los principales proveedores de RAID de hardware proporcionan software Linux que puede monitorear los dispositivos individuales detrás del adaptador. Estos se pueden vincular a Nagios, etc. para monitoreo.
Stefan Lasiewski
He puesto las respuestas a sus preguntas sobre SSD / hardware como información adicional en la pregunta (espero que esté bien, soy nuevo aquí). La idea es que, en la rara ocasión en que una de estas unidades falla en el campo, poder recuperar los datos reflejados de la que no ha fallado. El impacto de la pérdida de datos es alto. Sabiendo eso, ¿RAID1 todavía no sería un gran problema como dijiste?
mochatiger
3
@mochatiger Sabiendo lo que has dicho y que los SSD están muy sobreaprovisionados (40%), configuraría el RAID 1 de software como estabas planeando. La documentación de Red Hat está destinada a casos de uso general y hardware de consumo. Tu situación es definitivamente diferente.
ewwhite
8

¿Es esto algo de lo que debería preocuparme seriamente?

No

¿Hay alternativas de redundancia que pueda usar?

Prefiero controladores RAID de hardware, pero eso es algo personal, estás bien así.

Chopper3
fuente
1
Chopper, ¿puedes explicar por qué no deberíamos preocuparnos por esto? ¿No deberíamos preocuparnos por algo que haga que 'el rendimiento del SSD se degrade rápidamente'?
Stefan Lasiewski
2
Claro, si primero explica cómo este nivel de trabajo podría causar que el 'rendimiento del SSD se degrade rápidamente' dado que las SSD empresariales (OP utilizan el término 'industrial') de 2014.
Chopper3
5

La pregunta que debe hacer es cuándo se escribió esa documentación. Generalmente usan el mismo material y lo actualizan si es necesario, y la tecnología SSD ha cambiado desde entonces.

Aunque son industriales, el rendimiento de escritura y lectura no es lo mismo. La documentación se refiere al rendimiento de escritura, pero con una configuración de espejo, obtendrá un mejor rendimiento de lectura con / boot y / monturas.

Por lo tanto, cuestionar la documentación en algunos aspectos vale la pena.

paulcube
fuente
1

Puede usarlo sin muchos problemas en la configuración RAID1 flexible (incluso si el SSD no se aprovisionó demasiado), pero solo le proporcionó TRIM después de crearlo.

Puede hacerlo mediante uno de los siguientes:

  • usando un núcleo lo suficientemente nuevo que admite MD pasando TRIM a SSD (al menos 3.8.algo IIRC, pero verifique), y ejecutando fstrim (8) (desde el paquete util-linux) todas las noches

  • usando un kernel suficientemente nuevo y con la opción de montaje "descartar" (para ext4 / xfs). Tenga en cuenta que este es un rendimiento menor que el anterior, ya que TRIM no se puede poner en cola, y esto no aprovecha el procesamiento por lotes anterior

  • en núcleos más antiguos, ejecute cron run nocturno de mdtrim . ¡Asegúrese de probar con el script de prueba provisto antes de ponerle datos importantes!

También tenga en cuenta que todo se aplica solo para el sistema de archivos directamente en softRAID. No funcionará para la mayoría de los RAID de hardware. Además, (actualmente) no funcionará si tiene LVM o alguna otra capa encima de MD softraid. Necesitarás un exceso de aprovisionamiento para sobrevivir (y afortunadamente tienes el 40%, así que estás bien).

Matija Nalis
fuente