¿Un controlador RAID con un caché NV mejora el rendimiento o la integridad de una matriz SSD?

20

Estoy planeando comprar un servidor (Dell PowerEdge R740) con SSD en RAID 10, y mis prioridades son el rendimiento de escritura y la integridad de los datos. Estará ejecutando Linux. Los SSD tienen cachés de escritura con protección contra pérdida de energía.

Parece que estas son mis opciones de RAID:

  • PERC H330 (sin caché), RAID de software (transferencia)
  • PERC H330 (sin caché), RAID de hardware (escritura directa)
  • PERC H730P (caché NV de 2 Gb), RAID de hardware (escritura directa)
  • PERC H740P (caché NV de 8 Gb), RAID de hardware (escritura directa)

Mis preguntas:

  • ¿Alguna de estas configuraciones está en riesgo de pérdida de datos o corrupción por pérdida de energía?
  • ¿Qué configuración debo esperar para tener el mejor rendimiento de escritura?
  • ¿Hay otros beneficios para un caché NV que no haya considerado?

Preguntas relacionadas:

M. Dudley
fuente
1
Contra-intuitivamente, las configuraciones de controlador RAID de hardware respaldadas por SSD podrían funcionar con un rendimiento máximo menor al esperado cuando se habilita el almacenamiento en caché de reescritura. Pero veo que ya solo está considerando la escritura, por lo que parece ser consciente de eso.
the-wabbit

Respuestas:

16

Si se usa con SSD sin caché de escritura protegida contra pérdida de potencia, el NVCACHE del controlador RAID es extremadamente importante para obtener un buen rendimiento.

Sin embargo, como está utilizando SSD con memorias caché de escritura protegidas contra pérdida de potencia, el rendimiento no debería variar mucho entre las diferentes opciones. Por otro lado, hay otros factores a considerar:

  • con RAID de hardware, a menudo es más sencillo identificar y reemplazar un disco defectuoso: el controlador marca claramente la unidad afectada (por ejemplo: con una luz ámbar) y reemplazarla generalmente es tan simple como extraer la unidad antigua / insertar la nueva. Con una solución RAID de software, debe ingresar los comandos apropiados para identificar y reemplazar la unidad fallida;
  • RAID de hardware presenta al BIOS un volumen único para el arranque, mientras que RAID de software muestra los diversos dispositivos componentes;
  • con el controlador correcto (es decir: H730 o H740) y los discos (SAS 4Kn) puede habilitar muy fácilmente el campo de integridad de datos extendido (T10 / T13);
  • RAID de hardware ejecuta un blob binario opaco sobre el que no tiene control;
  • El RAID de software de Linux es mucho más flexible que cualquier RAID de hardware que haya usado.

Dicho esto, en una configuración de este tipo, le recomiendo encarecidamente que considere usar ZFS en Linux: las cachés de escritura protegidas contra pérdida de potencia significan que puede continuar sin un dispositivo ZIL dedicado, y las características adicionales de ZFS (compresión, suma de comprobación, etc.) pueden ser muy útiles .

Para responder directamente a sus preguntas:

  1. ¿Alguna de estas configuraciones está en riesgo de pérdida de datos o corrupción por pérdida de energía? No: como cualquier caché está protegida, no debe corromper ningún dato sobre pérdidas de energía.
  2. ¿Qué configuración debo esperar para tener el mejor rendimiento de escritura? El H740P configurado en modo caché de reescritura debería proporcionarle el máximo rendimiento de escritura absoluto. Sin embargo, en algunas circunstancias, dependiendo de su carga de trabajo específica, la escritura puede ser más rápida. El controlador DELL (y LSI) incluso tiene algunas características SSD específicas (es decir: CTIO y FastPath) que se basan en la escritura y pueden aumentar su rendimiento de escritura aleatoria.
  3. ¿Hay otros beneficios para un caché NV que no haya considerado? Sí: un controlador con un NVCACHE adecuado nunca permitirá que las dos patas RAID1 / 10 tengan datos diferentes. En algunas circunstancias, el software RAID de Linux es propenso a desajustes RAID1 (inofensivos) . ZFS no sufre de ese problema.
shodanshok
fuente
2
Realmente, ZFS es más que un RAID: tiene tiras de paridad variables, por lo que no hay listo-modificar-escribir o "agujero de escritura". Además, en lugar de un caché de página, ha avanzado ARC. Hay una cosa que falta: NV RAM ... que se puede resolver con la integración NV DIMM :)
BaronSamedi1958
13

P1: ¿Alguna de estas configuraciones está en riesgo de pérdida de datos o corrupción por pérdida de energía?

A1: No debería tener ningún problema, a menos que configure la memoria caché en el modo de reescritura y sin NV RAM.

P2: ¿Qué configuración debo esperar para tener el mejor rendimiento de escritura?

A2: ¡Uno tiene la mayor cantidad de caché, obviamente! ... y sin paridad RAID, pero RAID10 por supuesto.

P3: ¿Hay algún otro beneficio para un caché NV que no haya considerado?

A3: Escribir fusión, falsificación, etc. Pero en realidad son menores.

BaronSamedi1958
fuente
No estaba seguro de si el caché ayudaría porque leí que el reordenamiento de escritura no afecta mucho a los SSD, y porque los SSD tienen sus propios cachés de escritura.
M. Dudley
@ M.Dudley sí, tienen cachés, pero no puede tener demasiados cachés . El caché es bueno, cuanto más caché, mejor.
ThoriumBR
77
@METRO. Dudley: el controlador RAID tiene gigabytes de caché detrás del bus PCIe x4-x8 de carriles comparativamente rápido y de baja latencia, mientras que los cachés SSD están en megabytes y están detrás de enlaces SATA / SAS de 6-12 Gbps.
BaronSamedi1958
@ BaronSamedi1958 no importa tanto como podría parecer. Los "gigabytes de caché" se extienden por todo el volumen lógico que ha definido, por lo que desglosado en un solo disco podría reducirse a unos pocos megabytes por disco. Además, incluso el Samsung 850 Pro con fecha venía con 1 GB de caché DRAM, casi la mitad del caché completo del H730P. Por último, pero no menos importante: la interfaz SAS3 ofrece 12GB / s en un solo enlace, superando a los carriles x8 PCIe 3 en los que los controladores RAID están típicamente conectados.
the-wabbit
2
@ the-wabbit, aunque generalmente estoy de acuerdo con usted, su cálculo de ancho de banda es incorrecto: SAS3 tiene 12 Gb / so 1.5 GB / s como máximo por dirección. Un PCI-E 8x tiene un ancho de banda máximo de 128 Gb / so 16 GB / s por dirección. Además, el controlador SAS en sí mismo generalmente se cuelga de un enlace PCI-E ascendente, al igual que el controlador RAID.
shodanshok
0

Es posible que desee utilizar Bonnie ++ para hacer pruebas en tarjetas de banda de servidor / Perc vs SSD. el HDD acelera 5k / 10 / 16k rpm o las unidades híbridas variarán las estadísticas y el uso de caché.

otro defensor de ZFS ... Comencé a usar los servidores de SGI a mediados de los 90 y ZFS eliminó todo lo relacionado con UFS / ext2 / 3 ... es a prueba de bombas.

Munkeh72
fuente
0

Además de las buenas respuestas anteriores: un elemento a menudo olvidado pero requerido para la integridad extendida de cualquier RAID es la depuración de datos, también conocida como patrulla de medios o patrulla de lectura . Esto asegura que todos los datos en todos los discos sean legibles durante un tiempo prolongado.

Sin depuración es posible, y después de un período prolongado de tiempo y una gran cantidad de sectores, incluso probable, que los sectores de datos que no se han utilizado durante mucho tiempo ya no sean legibles. En el modo operativo normal, esto no es un problema, ya que el sector defectuoso se puede reconstruir utilizando datos de redundancia. Sin embargo, si un disco falla , ya ha perdido la redundancia (excepto RAID 6 o niveles RAID anidados) y cuando un sector defectuoso aparece durante la reconstrucción, está muerto en el agua.

Por lo tanto, siempre habilite la limpieza de datos a menos que le gusten las sorpresas desagradables.

Zac67
fuente