Estoy buscando construir una pequeña y agradable matriz RAID para copias de seguridad dedicadas. Me gustaría tener alrededor de 2-4 TB de espacio disponible, ya que tengo este desagradable hábito de digitalizar todo. Por lo tanto, necesito mucho almacenamiento y mucha redundancia en caso de falla de la unidad. Básicamente, también haré una copia de seguridad de las /home
carpetas de 2-3 computadoras usando uno de los clones de "Time Machine" para Linux. Esta matriz será accesible a través de mi red local a través de SSH.
Tengo dificultades para comprender cómo RAID-5 logra la paridad y cuántas unidades se requieren realmente. Uno supondría que necesita 5 unidades, pero podría estar equivocado. La mayoría de los diagramas que he visto todavía me han confundido. Parece que así es como funciona RAID-5, corrígeme ya que estoy seguro de que no lo estoy entendiendo correctamente:
/---STORAGE---\ /---PARITY----\
| DRIVE_1 | | DRIVE_4 |
| DRIVE_2 |----| ... |
| DRIVE_3 | | |
\-------------/ \-------------/
Parece que las unidades 1-3 aparecen y funcionan como una sola unidad masiva ( capacity * number_of_drives
) y las unidades de paridad respaldan esas unidades. Lo que me parece extraño es que generalmente veo más de 3 unidades de almacenamiento en un diagrama de solo 1 o 2 unidades de paridad. Digamos que estamos ejecutando 4 unidades de 1 TB en una matriz RAID-5, 3 de almacenamiento en ejecución y 1 de paridad en ejecución, tenemos 3 TB de almacenamiento real, ¡pero solo tenemos 1 TB de paridad !?
Sé que me estoy perdiendo algo aquí, ¿alguien puede ayudarme? Además, para mi caso de uso, ¿qué sería mejor, RAID-5 o RAID-6? La tolerancia a fallas es la máxima prioridad para mí en este momento, ya que se ejecutará en una red solo para uso doméstico, la velocidad no es muy crítica.
x
unidades yy
GB disponibles en cada unidad?Esto es lo que creo que es un mejor diagrama para mostrar cómo funciona la paridad en RAID4 y RAID5
RAID4
RAID5
fuente
Recomiendo leer este artículo de Wikipedia sobre Raid 5 y Raid 6
http://en.wikipedia.org/wiki/Standard_RAID_levels#RAID_5_parity_handling
RAID 5 escribe un bloque de paridad en cada tira, por lo que para la tira A de una matriz de 4 discos escribe la verificación de paridad en el 4to disco, con datos en los discos 1, 2 y 3
Para la tira B, el bloque de paridad está en el disco 3, con datos en los discos 1,2 y 4 ... etc.
Si dicho disco 4 falla, los datos se pueden recuperar para la Franja B, ya que conoce los datos en los discos 1 y 2 y tiene la comprobación de paridad en el disco 3.
Si la tira B tenía una paridad de "2" y el disco 1 tiene datos de "1" y los datos del disco 2 "0", entonces el disco 4 debe haber tenido datos iguales a "1" para que el disco se escriba con datos = "1"
Todo el disco se puede recrear de esta manera, RAID 6 extiende esto al tener 2 bloques de partes por banda.
Con respecto al espacio para la incursión 5, solo perderás un disco por paridad, ya que solo escribe en el bloque de paridad por banda, mientras que con la incursión 6 perderás 2 discos pero también puedes perder dos discos en lugar del que puedes perder en Raid 5;)
¡El artículo de Wikipedia lo explica mejor!
fuente
RAID 5 usa una unidad para la paridad, independientemente de cuántas unidades de datos haya en la matriz. Esto significa que se vuelve más eficiente, en términos de espacio utilizable, cuantas más unidades se agreguen.
La paridad se logra haciendo una operación XOR a través del mismo bloque en cada unidad; El contenido de la unidad de paridad se ajusta de modo que todas las unidades XOR se pongan a cero . Esto significa que RAID 5 está restringido por la capacidad más pequeña de todas las unidades de la matriz.
RAID 6 es similar, excepto que se pueden tolerar dos fallas simultáneas de la unidad. Esto es útil porque el proceso de " recuperación " de una matriz después de una falla de una sola unidad puede ser lo suficientemente estresante como para causar que falle una segunda unidad.
fuente
Si su objetivo es la tolerancia a fallas, RAID-6 proporcionará suficiente redundancia para perder dos unidades. Por lo general, RAID-5 solo tolerará una falla de una sola unidad.
fuente
drive_size * (drive_count - 2)
?