¿Cuáles son las diferencias de rendimiento entre Raid 0,1,5,6,10

29

He escuchado / leído diferentes historias de rendimiento sobre los diversos sabores de incursiones. Tengo curiosidad por cuál es la mejor respuesta acordada.

James Moore
fuente

Respuestas:

22

Una ubicación que vale la pena visitar es la Comparación de niveles RAID de StorageReview.com

Pero centrado en la respuesta:

NIVEL | CAPACIDAD | ALMACENAMIENTO | FALLO | RDM LEER | RDM WRITE | SEQ LEER | SEQ WRITE |
0 | S * N | 100% | 0 | **** | **** | **** | **** |
1 | S | 50% | 1 | *** | *** | ** | *** |
5 | S * (N-1) | (N-1) / N | 1 | **** | ** | *** | *** |
6 | S * (N-2) | (N-2) / N | 2 | **** | * | *** | ** |
0 + 1 | S * (N / 2) | 50% | 1 | **** | *** | **** | *** |

Leyenda:
Capacidad: Tamaño de la unidad
Almacenamiento: Cantidad de espacio en todas las unidades realmente utilizables
Falla: Número de unidades que pueden fallar

Chealion
fuente
o el original pcguide.com/ref/hdd/perf/raid/levels/comp.htm
Zac Thompson,
La falla 1 + 0 1 es claramente errónea. Tampoco es tan correcto con respecto a SEQ READ: ese número se relaciona con el diseño RAID-10 utilizado y puede ser incluso peor que RAID- {5,6}.
poige
@poige: ¿Cómo está mal el fallo? Cuando una unidad muere, causa que la mitad de RAID 1 falle (sin importar el tamaño de la porción RAID 0).
Chealion
1
@Chealion, por eso RAID-10 es una franja de espejos, no un espejo de rayas.
poige
3

Acordado sobre la mejor respuesta ...

Yo diría que es específico de la aplicación. Si eres un jugador que quiere acelerar todo y arrojar precaución al viento, ¡RAID0 es genial! Duplica sus posibilidades de falla del disco, pero si sus datos no son importantes, ¿a quién le importa?

RAID1 es todo lo contrario; Proporciona una copia de seguridad en caliente de todos sus datos y puede soportar un solo fallo de disco, lo que reduce a la mitad la probabilidad de pérdida de datos.

RAID5 y RAID6 son más caros (necesitan más discos) pero tienen la ventaja de poder resistir la pérdida de disco al tiempo que proporcionan un aumento de velocidad útil. Reduce a la mitad su probabilidad de pérdida de datos con RAID5 y lo reduce a la mitad con RAID6 (puede soportar dos discos y funciones perdidos).

Cuando se trata de RAID1 + 0 v. RAID5 / 6, RAID5 / 6 proporcionará un aumento de velocidad superior (debido a un mayor nivel de trazado de bandas) que RAID1 + 0, pero tiene el potencial de reducir la velocidad en caso de pérdida de disco (dado que los datos deben reconstruirse a partir de la información de paridad). RAID1 + 0, sin embargo, no perderá velocidad en caso de pérdida de disco (ya que no hay mucha ganancia de ancho de banda al tener un conjunto reflejado).

En cuanto a la restauración de la funcionalidad de un conjunto roto (de 1 + 0, 5 y 6), 1 + 0 sería lo más fácil. Solo tendría que copiar los datos de la unidad espejo a la nueva unidad, mientras que con RAID5 / 6, todas las unidades de la matriz participan en la recreación de los datos de un disco perdido.

Espero que esto haya ayudado :)

ParoX
fuente
Podría ser yo quien hizo algo mal, pero intenté usar RAID5 una vez, y las ventanas se volvieron realmente lentas y los discos duros funcionaban constantemente como locos. Así que terminé cambiando a RAID0 para el disco del sistema, creo ... fue MUCHO más rápido.
Svish
2

La respuesta de Chealion es perfecta, pero agregaría que la respuesta a su pregunta (cuál es la mejor) depende principalmente de tres factores:

  • Costo
  • Prioridad
  • Carga de trabajo

Las soluciones más baratas (que también pueden funcionar con el menor número de discos) son RAID 0 y 1, que están optimizadas para la velocidad y la pérdida de datos, respectivamente. Las soluciones más caras requieren más unidades, más potencia, más refrigeración y, por lo general, controladores RAID más caros. Usar RAID integrado en su placa base (basado en software) es diferente (y más lento) de comprar un controlador RAID real con respaldo de batería de varios cientos de dólares que traslada gran parte del trabajo pesado al hardware.

La prioridad se refiere a la importancia que le da a la pérdida de datos / velocidad / capacidad (elija cualquiera de los dos). Si tiene, digamos, 4 unidades de 500 GB para trabajar ... configuradas como RAID 0, tendría 2 TB de capacidad y un poco menos de 4 veces la velocidad de una sola unidad. Sin embargo, si alguna de esas unidades falla, se perderán todos sus datos. Si usa esas mismas 4 unidades como RAID 1, solo tiene la capacidad y la velocidad de una sola unidad, pero podría tener tres de las unidades que fallan y no perder ningún dato. RAID 0 o 1 con esa cantidad de unidades sería un desperdicio, y niveles como RAID 5 o 10 son un buen término medio.

Finalmente, la carga de trabajo hace la diferencia. RAID 5 y 6 tienen velocidades de escritura más lentas que varios otros niveles de RAID debido al hecho de que se debe calcular y escribir una suma de verificación para cada escritura (mientras que las velocidades de lectura son tan rápidas como los husillos). Algunas cargas de trabajo (como las bases de datos) pueden ser muy intensivas en escritura, y ejecutar RAID 5 puede marcar una diferencia notable con el rendimiento. Las cargas de trabajo intensivas de escritura a menudo funcionan mejor con niveles RAID como 10, 50, 60, etc. Otras cargas de trabajo (como servidores web) son principalmente intensivas en lectura, y la escritura no es una prioridad. En esos casos, tiene sentido usar un nivel RAID más barato como 5 que invertir en el hardware necesario para RAID 10/50/60.

Sean Earp
fuente
1

¡Por favor, ayúdame a completar esto! Estoy haciendo de esta tabla una wiki comunitaria. No vi una manera de hacer una tabla en rebajas y no quiero que todos reinventen la rueda. Entonces, ayúdame a completar esto (y arreglarlo si tengo errores).

Rendimiento teórico de lectura / escritura para varios niveles de RAID:

        |_____No_Failures____|_____One_Failure______
________|_Read_____|__Write__|__Read____|___Write___
RAID0   | 1x - Nx  |  Nx     |  FAIL    |   FAIL 
RAID1   | Nx       |  1x     |  (N-1)x  |    1x
        |          |         |          |
RAID5   |          |         |          |
RAID6   |          |         |          |
        |          |         |          |
RAID1+0 |          |         |          |
dmo
fuente
FWIW, Markdown por sí solo no puede hacer tablas - PHP Markdown Extra puede hacer tablas.
Chealion
Necesitará otra columna para R6 y RAD, ambos pueden manejar dos fallas de disco
Chopper3
Supuse que fallar dos discos es lo suficientemente raro como para que no te preocupe el rendimiento en ese momento. Pero si desea agregarlos, ¡siéntase libre! Además, si los usuarios registrados ven un enlace de "edición" aquí, tengo entendido que debería estar disponible para las wikis de la comunidad.
dmo
@Chealion: es un buen enlace (es posible que desee publicarlo como respuesta). Pensé que sería interesante ver las cosas cuantificadas aquí, pero para la mayoría eso es probablemente suficiente.
dmo
1

He visto implementaciones de RAID6 que fueron tan rápidas como RAID5, y algunas que fueron MUCHAS veces más lentas. Debe realizar una prueba con gran precaución al usar RAID6: es la opción correcta si funciona, pero puede ser un desastre.

Se debe evitar cualquier recomendación de anandtech o tomshardware para consejos serios como este. Estos son problemas serios, y esos sitios no hacen pruebas serias. Son bromas Tal vez comenzaron legítimamente, pero simplemente no lo son ahora.

He visto cargas de trabajo que eran intensivas en escritura aleatoria, con grandes cantidades de caché, donde RAID5 era tan rápido o incluso más rápido que RAID1 + 0. Esto se debe a que los datos se escribían a una velocidad lo suficientemente lenta (muchas escrituras, pero todos los bloques pequeños) donde el caché podría seguir vaciándolo al disco.

Tienes que probar tu carga de trabajo si realmente te importa.

carlito
fuente
0

En términos muy generales, 0 es el más rápido, luego 10, luego 1, luego 50, luego 60, luego 5, luego 6; una vez más, estos son en general. Eche un vistazo a un sitio como anandtech.com o tomshardware.com para obtener desgloses más detallados para tipos y velocidades específicos de discos / matrices.

Chopper3
fuente
0

Si la velocidad es la ÚNICA preocupación, entonces RAID0 gana sin comparación. Pero es raro que solo le importe la velocidad. RAID0 no tiene redundancia en absoluto y es mucho más probable que falle que un solo disco, así que tenga cuidado de cómo lo usa.

Scott Alan Miller
fuente