Estrategia RAID: 8 unidades de 1 TB

8

Estoy configurando un dispositivo de almacenamiento de respaldo: esta máquina tiene Windows Server 2008, en una unidad de arranque separada.

Tiene 8 unidades de 1 TB y utiliza una tarjeta RAID de hardware.

Mi pregunta es, ¿qué configuración de RAID debo elegir?

Inicialmente, iba a usar RAID 5 en las 8 unidades, sin embargo, los miembros de serverFault han desaconsejado. Me preguntaba por qué.

Algunas personas han sugerido 2 lotes de configuración RAID 5 en 4 de las unidades, y luego las separaron ...

Quiero maximizar el espacio de almacenamiento, ya que esta es una unidad de copia de seguridad: almacenará copias de seguridad de SQL, imágenes de Acronis, archivos, etc. No será para acceso público, por lo que la E / S no será tan alta. No pensaría

alex
fuente
77
ZFS es lo que realmente quieres :)
Bill Weiss el

Respuestas:

19

Para una copia de seguridad pura y fría, diría que RAID5 está bien. RAID5 tardará una cantidad considerable de tiempo en restaurarse en unidades SATA de 8x1TB, pero dadas las posibilidades de que algo se rompa con IOPS bajas, eso probablemente no sea crítico. Si desea un poco más de seguridad, elija RAID6, que le dará la capacidad de sobrevivir a dos fallas simultáneas en el disco.

Mark S. Rasmussen
fuente
3
Actualmente estoy usando un RAID6 con 8 unidades de 1TB, y funciona excelente.
phuzion el
66
1 de RAID 6 sugerencia
Aaron
1
+1 RAID 6. En esta aplicación, el rendimiento generalmente no es tan importante. Si le preocupa el tiempo de recuperación, dependiendo de sus datos, RAID 10 con compresión puede proporcionar el almacenamiento que necesita y acortar el tiempo de reconstrucción.
duffbeer703
otro +1 para RAID6. Tengo 7x750GB en RAID6, y funciona bastante bien (y he tenido unidades mueren un par de veces, y se recuperó bien).
James Cassell el
44
Hay aproximadamente un 60% de posibilidades de un error de lectura irrecuperable al reconstruir una matriz RAID5 de 8 discos que consta de unidades de 1TB. RAID6 y RAID10 son las únicas opciones tradicionales seguras en este escenario, pero lo que realmente quiere es RAIDZ2. Más información sobre grandes matrices RAID5 y errores de lectura irrecuperables.
Skyhawk
15

Aquí hay un buen artículo sobre: Por qué RAID 5 deja de funcionar en 2009

Aquí hay un resumen rápido:

  • Falla de disco: con 7 discos tiene ~ 20% de posibilidades de ver una falla de disco en un año. Es muy probable que vea una falla durante la vida útil operativa del almacenamiento.
  • Fallos de lectura: "Las unidades SATA se especifican comúnmente con una tasa de error de lectura (URE) irrecuperable de 10 ^ 14". Esto significa que para un hipotético almacenamiento de 12 TB es probable que vea fallas de lectura. Esto es solo una función de la creciente cantidad de almacenamiento que se usa comúnmente. Más almacenamiento, más fallas de lectura.

Funciona así según el autor: más discos (mayor probabilidad de falla del disco) + más espacio en disco (mayor probabilidad de una falla de lectura) = mayor probabilidad de que ambos eventos ocurran al mismo tiempo . Lo que matará su matriz RAID es cuando falla un disco y mientras su matriz se está reconstruyendo, tiene un error de lectura.

La solución del autor: RAID-6

Aquí hay un comentario que parece resumirlo bastante bien:

El punto clave que parece perderse en muchos de los comentarios es que cuando un disco falla en una matriz RAID 5 y tiene que reconstruirse, existe una posibilidad significativa de un error de lectura no recuperable durante la reconstrucción (BER / UER). Como ya no hay redundancia que la matriz RAID no pueda reconstruir, esto no depende de si está ejecutando Windows o Linux, hardware o software RAID 5, es matemática simple. Un controlador RAID honesto registrará esto y, en general, abortará, permitiéndole restaurar datos no dañados de la copia de seguridad en una matriz nueva.

Notas del editor: puede usar unidades SCSI o SAS de calidad ...

rkthkr
fuente
1
Buen artículo, y buen punto. Me encuentro con un montón de conocimientos folclóricos y tribales sobre RAID que no son compatibles con las matemáticas. Es fundamental comprender la lógica y las probabilidades RAID.
pboin el
Hay un buen punto planteado en este artículo, pero no puedo estar de acuerdo con las conclusiones. El autor afirma que RAID-6 tampoco es una solución y cuestiono la validez de esta declaración.
dtoubelis
Muy buen resumen. Acabo de construir una matriz RAID5 de 13TB y parece ser una muy mala solución
Jan Zahradník
El mismo autor escribió "Por qué RAID 6 deja de funcionar en 2019"
5

Si opta por RAID 5, sufrirá un pánico vertiginoso durante aproximadamente un día mientras se reconstruye la matriz para incluir su reemplazo. Si opta por RAID 6, cuando falla una unidad, puede permitirse una nueva falla durante la reconstrucción, de modo que el pánico que lo detiene se reduce a una simple alarma leve.

Si fuera yo, iría por 6, pero a veces tengo problemas con mi presión arterial como está ...

James Green
fuente
3

Mi recomendación es ir con RAID-6 sin ninguna duda. Especialmente teniendo en cuenta que está utilizando unidades de 1TB.

Aquí está mi experiencia. Durante los últimos 4-5 años estuvimos ejecutando 3 arreglos RAID-5 con unidades de 2TB: 2 por 5x y 1 por 10x (espero no ser críptico aquí :-). Durante este tiempo experimentamos 3 o 4 fallas en el disco duro. Solo una vez que la matriz se reconstruyó sin problemas. Todas las demás veces hubo errores durante la reconstrucción. Uno de ellos fue catastrófico y nos costó $ 12,000 en honorarios a la empresa de restauración de datos. La gravedad de una falla dependía en gran medida de la inteligencia del software / firmware RAID. La falla catastrófica fue con el software RAID de Linux. Las fallas recuperables fueron con el controlador de hardware Adaptec. (Básicamente, solo marca una franja como mala si descubre una URE y luego continúa. fsckDespués de la reconstrucción y de vuelta al negocio. Puede perder uno o dos archivos, pero no toda la matriz).

Desde entonces migramos nuestros datos a matrices RAID-6 con buenos controladores de hardware. Experimentamos el primer fallo de la unidad hace unos meses y la recuperación fue rápida.

Muchos justificarán el uso de RAID-5 vs RAID-6 por razones de rendimiento (estoy citando parcialmente mi propia respuesta a otro hilo aquí), ... esta diferencia de rendimiento es TEÓRICA. Desde mi experiencia, la diferencia de rendimiento REAL entre RAID-6 y RAID-5 es insignificante o inexistente. Estoy hablando de RAID de hardware con un controlador decente con al menos 8 unidades y un sistema con suficiente memoria para proporcionar un buen almacenamiento en caché. En esta configuración, la velocidad de escritura probablemente esté limitada por el ancho de banda del bus SATA / SAS / SCSI ...

Otra desventaja o RAID-6 es el costo de esta unidad adicional. Pero déjame ponerlo en perspectiva. Probablemente pagaría $ 200-500 más por una unidad adicional, pero compare esto con el costo del tiempo de inactividad o las tarifas de recuperación si algo sale mal ... Solo considere esto como una prima de seguro :-)

dtoubelis
fuente
1

Yo diría que vaya por Raid5 sobre 7 discos, y mantenga uno como HS. Pero todo depende realmente del controlador RAID que esté usando y del tipo y calidad de sus unidades.

dyasny
fuente
1
¿Por qué desperdiciaría una unidad que podría usarse fácilmente para mejorar la capacidad o la tolerancia a fallas?
Nic
Si crees que los discos de repuesto son un desperdicio, no hay mucho más que pueda decirte. darle tiempo, verá el uso de SA si se queda el tiempo suficiente
dyasny
Estoy dispuesto a convencerme, así que creé una nueva pregunta sobre el tema.
Nic
1

Tendrá que calcular cuánto valen sus datos, en dólares del mundo real, y cuán molesto o costoso será un fallo antes de poder pensar en estrategias de almacenamiento. Una pista es que la respuesta no puede ser "sin pérdida alguna", porque eso tiene un costo infinito.

Use ese costo / tiempo / datos para guiar cuánto tiempo puede tolerar una reconstrucción, o cuántas horas puede fallar el sistema, o cuánto dinero desea gastar en hardware.

Jim Zajkowski
fuente
0

En mi archivador ejecuto una incursión de software 5 en ocho unidades s-ata de 500 GB, que funciona muy bien. Rendimiento de lectura cercano a 160 MB / s, rendimiento de escritura de alrededor de 90 MB / s. El tiempo de recuperación es de aproximadamente 20 horas. Athlon X2 4200+ y chipset nvidia.

Como esto se va a utilizar para el almacenamiento de respaldo, no veo la necesidad de la incursión 6. Es poco probable que dos unidades en la incursión de respaldo fallen dentro de unos días, al mismo tiempo que los datos de producción se dañan o se pierden.

Roy
fuente
0

RAID5 en 8 discos debería estar bien, excepto que tendrá un bajo rendimiento de escritura ya que tiene que calcular el bit de perity. Sin embargo, el rendimiento de lectura debería ser realmente excelente.

Estoy bastante seguro de que la cantidad máxima recomendada de discos para RAID5 es 12, pero todo depende de cómo use la matriz si puede usar esa cantidad, cuantos más discos agregue, más lenta será su reconstrucción y escritura.

ITGuy24
fuente
1
Eres wronjg. Adaptec admite más de 12 discos en un Raid 5.
TomTom
Existe una diferencia entre lo que se admite y lo que se recomienda como práctico para un entorno de producción. Estaba haciendo una recomendación que no indicaba un hecho cuantitativo.
ITGuy24
Nunca he visto un número tan alto para el número de discos "recomendado" tbh, siempre he ido por 6 o menos solo porque los discos adoran morir en grupos. Más de 12 lo expone a una gran pérdida potencial de datos.
Mateo
0

Si es solo para fines de copia de seguridad y IO no importa, la incursión 5 debería estar bien, la incursión 6 sería aún mejor, pero estaría perdiendo espacio de almacenamiento. ¿Qué tan críticos son sus datos? También puede hacer una incursión 5 + 0 compuesta por dos incursiones de 4 discos de 5. Esto le permitiría perder 2 discos, brindarle un mejor IO y dejarlo con aproximadamente 6 TB utilizables, pero existe una buena posibilidad de que su controlador no lo admita (por lo general, requiere cosas de mayor nivel). La incursión 6 es la más lenta de todas las opciones, le permite perder 2 discos y aún le dejará con unos 6 TB utilizables.

Mateo
fuente