RAID5 vs RAID4 propósito de paridad flotante

9

Todavía no entendí por qué RAID5 es mejor que RAID4. Entiendo que los dos bits de paridad de cómputo que se usan para la recuperación si ocurre alguna falla, la única diferencia está en almacenar esos bits de paridad. He tomado prestados diagramas de aquí. ¿Cómo funciona la paridad en una matriz RAID-5?

A B (A XOR B)
0 0    0
1 1    0
0 1    1
1 0    1

RAID4

Disk1   Disk2   Disk3   Disk4
----------------------------
data1  data1  data1  parity1
data2  data2  data2  parity2
data3  data3  data3  parity3
data4  data4  data4  parity4

Digamos que la primera fila es:

data1 = 1
data1 = 0
data1 = 1
parity1 = 0 (COMPUTED: 1 XOR 0 XOR 1 = 0)

RAID5

Disk1   Disk2   Disk3   Disk4
----------------------------
parity1 data1   data1   data1   
data2   parity2 data2   data2  
data3   data3   parity3 data3
data4   data4   data4   parity4

Digamos que la primera fila es:

parity1 = 0 (COMPUTED: 1 XOR 0 XOR 1 = 0)
data1 = 1
data1 = 0
data1 = 1

Scanarios:

1. RAID4 - FALLO del disco3:

data1 = 1
data1 = 0
data1 = 1 (COMPUTED: 1 XOR 0 XOR 0 = 1)
parity1 = 0

2. RAID4 - Disco4 (paridad) FALLO:

data1 = 1
data1 = 0
data1 = 1 
parity1 = 0 (COMPUTED: 1 XOR 0 XOR 1 = 0)

etc.

En general: cuando RAID (4 o 5) usa N discos y uno falla. Puedo tomar todos los valores restantes de discos no fallidos (N-1) y XOR (dado que XOR es una operación asociativa) y obtendré el valor fallido. ¿Cuál es el beneficio de almacenar la paridad no en un disco dedicado sino en un ciclo? ¿Hay algún beneficio de rendimiento o qué? Gracias

Wakan Tanka
fuente

Respuestas:

12

Hay una diferencia de rendimiento en que con RAID 4 cada cambio requiere escribir en el disco de paridad único, lo que significa que las cosas pueden hacer cola para actualizar los datos de paridad en ese disco.

Con RAID 5, tiene una reducción significativa en esto porque la carga de actualización de paridad se distribuye en varios discos, por lo que hay menos posibilidades de quedarse atascado en una cola.

Aquí hay un buen enlace de Fujitsu con una breve explicación y algunas animaciones agradables para ayudar a aclarar el rendimiento / penalizaciones de RAID 4 (así como otros niveles de RAID).

Ƭᴇcʜιᴇ007
fuente
Muy buena animación. Gracias
Wakan Tanka
-2

OWC ha dicho con sus gabinetes y utilizando su software SoftRaid, que RAID 4 es más rápido para lecturas que RAID 5. Mismo nivel de protección, mismas velocidades de escritura, mejores velocidades de lectura, voy con RAID 4 en mi gabinete OWC Thunderbolt 3 con Cuatro unidades NVMe.

Zathras
fuente
Ese podría ser el caso de OWC, pero en general no es cierto debido a las razones dadas en la respuesta de zx485. También sería una buena idea proporcionar una referencia (como un enlace al artículo al que se refiere).
StarCat
Buen punto. Aquí hay un enlace. macperformanceguide.com/… Seamos claros, el argumento en contra de RAID 4 sería en una situación en la que un grupo de usuarios está accediendo a los datos, lo que puede conducir a que el acceso al disco de paridad ralentice las cosas. En la situación de un solo usuario, una conexión Thunderbolt 3 simplemente no será un problema y es probable que RAID 4 sea más rápido.
Zathras