¿Repuesto dinámico o unidad de paridad adicional en la matriz RAID?

10

En una pregunta diferente sobre la configuración de una matriz RAID, el autor está creando una matriz RAID con 8 unidades.

Una respuesta sugiere usar 7 unidades en RAID 5 con una sobra como repuesto dinámico. Dado que RAID 6 protege contra dos fallas, incluso si son concurrentes, supuse que siempre sería una mejor opción.

¿Cuándo utilizaría un repuesto dinámico en lugar de una unidad de paridad adicional?

Nic
fuente
La respuesta correcta aquí, por supuesto, es que debe usar RAID6 con un repuesto dinámico (o tal vez incluso 2)
Mark Henderson

Respuestas:

6

La única buena razón para tener un repuesto dinámico en mi opinión es si tiene varios arreglos RAID-5/6 y desea compartir el repuesto entre ellos. De lo contrario, es un desperdicio.

Muchos justificarán el uso de RAID-5 + repuesto frente a RAID-6 por razones de rendimiento, pero esta diferencia de rendimiento es TEÓRICA. Desde mi experiencia, la diferencia de rendimiento REAL entre RAID-6 y RAID-5 es insignificante o inexistente. Estoy hablando de RAID de hardware con un controlador decente con al menos 8 unidades y un sistema con suficiente memoria para proporcionar un buen almacenamiento en caché. En esta configuración, la velocidad de escritura probablemente esté limitada por el ancho de banda del bus SATA / SAS / SCSI. Entonces, si el rendimiento no es un argumento, todo lo demás habla a favor de RAID-6.

dtoubelis
fuente
+1: estoy de acuerdo. No veo ninguna razón para usar RAID-5 cuando RAID-6 está disponible. Benchmark del hardware. Debería poder hacer RAID-6 a toda velocidad, o casi.
Zan Lynx
Si es cierto que la diferencia de rendimiento práctico es insignificante, entonces la única razón convincente para usar un repuesto dinámico es compartirlo entre varios arreglos. Entonces elegí esta respuesta.
Nic
1
ahora que ZFS RAID-Z3 (3 unidades redundantes) está maduro, es más seguro que RAID6 + un repuesto dinámico.
BeowulfNode42
4

Normalmente, sugeriría evitar RAID 5 a favor de RAID 10 ... Pero para responder a su pregunta, esto puede ser una función de las necesidades y requisitos de su aplicación, así como de la capacidad de las unidades.

Un ejemplo del uso de un repuesto en lugar de la doble paridad es cuando el rendimiento es una prioridad y hay poca preocupación sobre el tiempo de reconstrucción (como con los discos de alta capacidad) o una segunda falla durante la reconstrucción RAID 5.

ewwhite
fuente
3

Cuando el rendimiento importa más que la posibilidad de que pueda perder dos unidades rápidamente. Agregar una segunda paridad, significa que el controlador RAID, tendrá que calcular esa segunda paridad. Aunque si estuviera realmente preocupado por el rendimiento, probablemente no estaría mirando RAID5 en absoluto.

Además, no olvides que si eres extremadamente paranoico, puedes hacer RAID6 y hot spare.

También tenga en cuenta que RAID5 es más común, algunos controladores ni siquiera admiten RAID6.

Zoredache
fuente
Los controladores de incursión de hardware actuales ofrecen la misma velocidad para la incursión 1 que para la incursión 5 o la incursión 6. La penalización de velocidad podría haber sido cierta para la incursión de software y cuando los procesadores eran lentos.
Nils
Estrictamente hablando, no hay 2 cálculos de paridad separados en Raid6. Es más como expandir (n-2) bits de datos en (n) bits de (datos + paridad) usando una fórmula especial. (En realidad, es más parecido a la codificación Solomon-Reed). En la actualidad, los controladores hacen esto en un hardware altamente optimizado, por lo que el rendimiento es mínimo. Si está condenado a hacer software-Raid, Raid5 probablemente funcionará mejor ya que ese cálculo es más fácil en el software.
Tonny
En realidad sí, hay dos cálculos de paridad separados. pnormalmente se calcula rápida y fácilmente (XOR), mientras que qes un cálculo más complejo. No es que la incursión de software6 incluso se considere lenta en el hardware actual: mi computadora portátil informa una tasa de cálculo de paridad (generación, no reconstrucción) de 10446 MBps.
MikeyB
1
+1 para su segundo párrafo: RAID6 con repuesto dinámico es la verdadera respuesta correcta
Mark Henderson
2

Suponiendo que RAID 10 no es una opción, desde un punto de vista de redundancia estricta, preferiría RAID 6 con un repuesto en frío sobre RAID 5 con un repuesto en caliente. Las probabilidades de dos fallas simultáneas son bajas, pero RAID 6 también reduce los URE al tener mejores datos de paridad.

Desde una perspectiva de rendimiento, no puede usar los dos indistintamente. RAID 6 tiene una penalización de escritura más alta que RAID 5, por lo que sus escrituras sufrirán. Además, RAID 6 con dos unidades degradadas en la matriz (segundo peor de los casos a un fallo completo) funcionará miserablemente durante una reconstrucción.

A fin de cuentas , si tiene en cuenta el bajo rendimiento de RAID 6 y sigue siendo una opción y RAID 10 no es una opción, entonces diría que vaya con RAID 6 y mantenga al menos un repuesto en frío en un estante en algún lugar.

MDMarra
fuente
2

Básicamente...

  • Si usas raid 5 + 1.

  • tiene un disco de intercambio en caliente que es como estar fuera de uso. Entonces ... el disco no cuenta minutos de trabajo. cuando va a reemplazar otro disco, entonces será como un disco nuevo.

  • no puede estar seguro de si el disco estará bien. Si falla cuando reemplaza un muerto ...
  • Incursión 5 + 1 Escritura = una paridad (Menos CPU)
  • En caso de disco defectuoso, Raid entra en modo degradado y comienza a reconstruir en el disco de repuesto. entonces reemplazas el disco de repuesto

Si usas la incursión 6

  • El disco está en uso ... Por lo tanto, el disco siempre funcionará y podrá supervisar su estado bajo carga de trabajo.
  • Raid 6 Write = doble paridad (Más CPU)
  • En caso de disco defectuoso, Raid entra en modo degradado y espera a que reemplace el disco defectuoso. Si el segundo disco falla, permanece degradado pero sin paridad. Comenzará la recuperación cuando un nuevo disco esté en la incursión.

En algunos casos de falla, causa de energía o temperatura en sistemas con flujo de aire defectuoso, esto hará que los dispositivos izquierdos trabajen más que en una incursión de estado óptima.

Tomemos como ejemplo Raid 5 + 1 con 6 discos La carga está equilibrada en 5 discos y 1 está esperando si 1 falla, entonces la CPU se eleva para recuperar la paridad en el nuevo disco

Tomemos como ejemplo Raid 6 con 6 discos. La carga está balanceada a 6 discos. si 1 falla, entonces la CPU no va más alto pero el disco sube porque la carga está equilibrada a 5. si falla 2, entonces la CPU no vuelve a subir pero el disco vuelve a subir ya que la lode está balanceada a 4 discos

Mi opinión es utilizar el repuesto dinámico SOLAMENTE si tiene más de 1 volúmenes de incursión en el mismo sistema, por lo que podrá usar un repuesto dinámico en todos los volúmenes de incursión.

dSoultanis
fuente
1

¿Ha probado el rendimiento de sus aplicaciones contra una matriz RAID5 que se ejecuta en modo degradado durante una reconstrucción? Si no, creo que descubrirías que no funcionan muy bien en absoluto. En algunas aplicaciones críticas de alto rendimiento de E / S, esto podría significar que la aplicación está esencialmente inactiva hasta que se complete la reconstrucción. Y con unidades de gran capacidad, eso podría llevar mucho tiempo. El objetivo debe ser evitar esa situación de reconstrucción si es posible.

Greg Askew
fuente
2
Con los mejores controladores de banda puedes ajustar la velocidad de reconstrucción. En sistemas de producción con alta carga de io deben ser bajos. En los sistemas de prueba pueden ser altos.
Nils
-1

Voy con la respuesta de ewwhite con respecto al problema del tiempo de reconstrucción. Pero cuando el tiempo de reconstrucción no es un problema, usaría los 8 discos en la incursión 5, eso dará aún más velocidad (en circunstancias normales). Si una unidad falla, intercambie en caliente con una nueva (esto supone que los discos son intercambiables en caliente).

Nils
fuente
... y ore para que ninguno de los otros 7 discos en la matriz encuentre un problema latente, o desarrolle un problema, durante la reconstrucción.
un CVn
@Michael Kjörling: 5 años después con discos más grandes, iría a Raid 6. Pero no sobra. Pero los servidores de hoy también tienen más de 10 discos.
Nils