RAID 6 vs RAID 10? Cuál escogerías

11

Mi elección sería RAID 6 para un servidor de archivos, ya que puede perder dos unidades y no importa qué conjunto de dos puede morir. Por lo que entiendo con RAID 10, puede perder dos unidades, pero si están en la misma matriz RAID 1, ¿no tiene suerte? ¿Alguna sugerencia? Servidor de archivos básico con aproximadamente 200 GB de datos y actuaría como un único punto de respaldo para otras estaciones de trabajo y servidores.

dasko
fuente
"punto único de respaldo" significa un repositorio de respaldos de toda la red. este es su único punto que luego hace una copia de seguridad en los medios. Nunca haría una copia de seguridad de un servidor y luego otro y otro. eso funcionaría si tuvieras solo uno, tenemos alrededor de 10.
Si su objetivo real es tener un lugar "seguro" para almacenar copias de seguridad, entonces simplemente compraría una pila de discos, luego cambiaría los discos diariamente y colocaría los no utilizados en un lugar seguro contra incendios, o incluso mejor, en un lugar seguro . RAID solo ayudará con el rendimiento y el tiempo de actividad incluso en caso de una falla de un solo disco, pero no si el servidor se derrite o el edificio se incendia. En el pasado, esto se hacía con unidades de cinta, pero en la actualidad, los discos adicionales son probablemente una forma mucho más económica y más fácil de administrar.
Jed Daniels el
dasko, ¿alguno de los siguientes elementos responde a tu pregunta?
James Cape

Respuestas:

12

Depende de lo que estés tratando de hacer. Si bien Raid 10 le daría lecturas y escrituras más rápidas de las dos, como usted dijo, es posible perder todo si pierde las dos unidades incorrectas. Pero en matrices de discos más grandes podría perder exactamente la mitad de las unidades y retener operaciones completas. Pero con Raid 6, sus escrituras podrían ser un poco más lentas b / c de la suma de verificación adicional. Pero podría perder dos unidades y no perder ningún dato.

Creo que otro punto importante para recordar es que Raid no es una copia de seguridad de datos . Por lo tanto, lo principal que debe analizarse RAID es el tiempo de actividad del servidor. No mantener los datos intactos.

Creo que al final es una cuestión de preferencia. Yo iría personalmente con Raid 10; Para matrices realmente grandes, es posible que pueda extraer un RAID 50 o 60. Donde el disco en el conjunto rayado podría protegerse con raid 5 o raid 6.

Algunas buenas lecturas:

Ryan Gibbons
fuente
2
Si bien RAID no es una copia de seguridad ... en este caso, creo que su definición de copia de seguridad es sólida. A medida que los datos originales viven en estaciones de trabajo y otros servidores y se respaldan en este servidor. Lo que sucede es usar RAID para ayudar a la disponibilidad.
3dinfluence
55
Permítanme agregar entonces: la copia de seguridad en línea no es una copia de seguridad. Si se trata de una copia de seguridad, debe almacenarse en cintas / discos y colocarse en una caja fuerte en algún lugar lejos del resto de los sistemas. RAID no ayuda en eso.
pehrs
1
Creo que esto también depende de los tipos de unidades utilizadas, pero para un servidor de archivos básico RAID 6 es suficiente. Reserve RAID 10 para el servidor SQL de alta carga.
murisonc
44
@cypher Los sistemas de respaldo en línea tienen dos propiedades muy desagradables: 1: es posible borrar todo el respaldo a través de accidentes o errores en el sistema de respaldo, a menudo sin darse cuenta. La verificación y restauración desde un sistema fuera de línea se realiza solo de lectura, lo que reduce los riesgos para sus copias de seguridad. 2: Lo más probable es que una copia de seguridad en línea no esté en una caja fuerte a prueba de fuego sin conexiones externas. Una vez que haya hecho que un electricista alimente 480V en su sala de servidores, aprenderá esa lección.
pehrs
2
El principal problema con la incursión es que significa que las unidades se usan constantemente y están sujetas a desgaste, por lo que es mucho más probable que fallen que una unidad sin conexión o una copia de seguridad en cinta. Además, no protege contra la corrupción de datos o eliminaciones replicadas. Las cintas / unidades sin conexión pueden tener sus propios problemas, la única forma segura es de varias etapas.
JamesRyan
7

[Supongo que te sientes cómodo con el impacto en el rendimiento de RAID6 y solo te preocupan las fallas]

Estoy usando los números de http://en.wikipedia.org/wiki/Standard_RAID_levels , y soy un asco en matemáticas, por lo que esto puede estar mal. Supongamos que el 5% de sus unidades morirán dentro de 1 año.

La probabilidad de que un miembro de la doble-RAID 1 pura y simple de morir es la probabilidad de cualquier unidad dada de morir, al cuadrado: P(R1) = P(drive)^2.

Entonces, con la tasa de falla del 5%, terminas con:

P(R1) = 0.005^2 = 0.0025 = 0.25%

(Aquí es donde no estoy seguro sobre las matemáticas --- tiene sentido, pero eso no significa nada)

Por lo tanto, las posibilidades de perder a cualquier miembro de R1 son de 0.25% por año, pero tiene varios de ellos unidos, y si alguno de ellos muere, su matriz está muerta. por lo que necesita para tapar el número P (R1) en el fallo de matemáticas R0: P(R10) = 1 - (1 - P(R1))^(n_R1). Supongamos que tiene 8 unidades en total (y no las reemplace cuando fallan), por lo que una franja en 4 R1:

P(R10) = 1 - (1 - 0.0025)^4 ~= 0.99%

Por lo tanto, tiene aproximadamente un 1% de posibilidades de perder un RAID10 que tiene 8 unidades con un 5% de posibilidades de falla por año.

Simplísticamente, la probabilidad de que RAID6 falle es la probabilidad de que una unidad determinada muera en cubos (ya que tiene que perder tres unidades para que falle), por ejemplo:

P(drive)^3 = (5%)^3 = 0.0125%

Entonces, para el escenario de "múltiples unidades muriendo", RAID6 tiene aproximadamente 1/80 de probabilidad de fallar como RAID10 con las mismas unidades.

Desafortunadamente, la vida es complicada y hay que lidiar con sectores que van mal. Es muy probable que se introduzcan errores aleatorios en sus unidades que pasan desapercibidos. Ya no solo estoy copiando wikipedia aquí, pero supongo que es probable que aparezca un sector defectuoso en cualquier unidad P(bs) = P(UBER) * bits_written. Si eso sucede, la recuperación después de una falla de la unidad es imposible en un R1 y más complicada en un R6.

Por supuesto, todo eso es discutible si el controlador o controlador RAID6 tiene errores, e introduce errores en sus datos, o corrompe su matriz :-)

James Cape
fuente
2
Que las matemáticas son buenas, pero durante una reconstrucción, las unidades de paridad / espejo se ven afectadas específicamente más que ninguna otra y, por lo tanto, es mucho más probable que fallen que la tasa de falla promedio. Por lo tanto, RAID10 es aún más probable que pierda esa segunda unidad de disco específica.
JamesRyan
1
paridad / espejo es 1 unidad en RAID10 pero se extiende a través de todas las unidades en RAID6
JamesRyan
2
Otra consideración es que las unidades compradas en lotes tienden a morir en lotes, lo que hace que las fallas de múltiples discos sean más comunes de lo que sugerirían las matemáticas simples. (¡Una lección aprendida de la manera difícil!)
mattdm
1
Si bien RAID10 generalmente se construye utilizando solo pares RAID1 de 2 unidades, no siempre es así. Linux mdadmpermite crear un diseño RAID10 con cualquier nivel de redundancia (2, 3, 4, ...), siempre que sea menor que la cantidad de unidades en la matriz (por lo que es posible crear un RAID10 con dos copias de datos con solo 3 unidades). La --layout=opción permite establecer el número de copias.
Hubert Kario
2

Para una estación de trabajo o un servidor principalmente intensivo en CPU, votaría por RAID 10 para un mejor rendimiento de lectura / escritura.

Para un servidor de almacenamiento de datos, iría con RAID 6.

Si es posible, usaría el RAID 10 en mi estación de trabajo y servidores y usaría un RAID 6 en un servidor de archivos para mantener los archivos de respaldo.

wag2639
fuente
0

Los servidores de archivos suelen estar más vinculados por el enlace de red. Entonces, para un servidor de archivos típico, optaría por la protección adicional que ofrece RAID6, ya que al final del día la velocidad a través de la red será su cuello de botella.

Si está ejecutando algo local en el servidor, como una gran base de datos o máquinas virtuales, optaría por la configuración RAID10.

3dinfluence
fuente
0

Raid6 es mucho más seguro que R1. La probabilidad es del 5% de que el disco falle durante un año. Raid6 fallará si 3 discos morirán en el mismo día. Entonces la probabilidad de eso es 0.05 * 1/365 = 0.000014. Por lo tanto, la probabilidad de fallar Raid6 es 2.6 E-12, que es mucho menor que la probabilidad de ganar en la lotería. Si el disco se rompe en la matriz Raid6, puede cambiarlo y el controlador RAID comenzará a reconstruir la matriz RAID inmediatamente. Se necesita la aplicación. 1 día para f. ex. Disco reconstruido de 2TB en la matriz Raid6. Por lo tanto, debe tener fallas durante un día o incluso menos si está utilizando un disco más pequeño que 2 TB.

Pero como se dijo aquí, mantenga una copia de seguridad real en funcionamiento continuo. Algún día, su fuente de energía puede morir y darle un voltaje adicional a su sistema y todos los discos duros se desconectarán después de eso, así como así (o sucede algo extraño, quién sabe). Por lo general, esto no sucederá, pero si realmente necesita sus datos, vuelva a realizar una copia de seguridad en otro lugar que no sea la matriz Raid.


fuente