¿RAID 0 es tan riesgoso como la gente dice que es?

9

Estoy a punto de configurar mis discos duros con RAID 0. ¿Es realmente tan arriesgado como la gente dice que es?

hard-drive raid quijote curandero
fuente

22

RAID 0 duplica su probabilidad de falla de almacenamiento (suponiendo una Raid 0 de 2 discos). ¿Por qué? Porque ahora confía en la fiabilidad de 2 discos, en lugar de solo uno.

RAID 10 trae de vuelta un nivel razonable de confiabilidad.

kmarsh
fuente

¿RAID10 es solo un nivel de fiabilidad "razonable"?

Josh el

52

@ Josh: Sí. Fire no comprueba qué nivel de RAID ha configurado en su servidor.

@womble +1 - eso es bastante divertido :)

Coops

2

Obligatorio "RAID no es una copia de seguridad". ¡Fuego fuego Fuego!

Bratch el

2

@womble: Tu comentario es más votado que esta respuesta, y la pregunta combinada.

Macha el

8

RAID 0 significa redundancia CERO. Cada vez que se escriben datos en el dispositivo RAID, se dividen en dos, la primera parte se escribe en el primer disco, la segunda parte en el segundo, lo que hace que su operación de escritura sea bastante rápida. Pero si alguno de los discos se rompe, todos sus datos se pierden (ya que pierde (aproximadamente) el 50% de todos sus archivos, dejándolos inútiles)

soulmerge
fuente

8

Para aclarar "perder el 50% de todos sus archivos" ... Se pierde la mitad de cada archivo; no puede recuperar el 50% de la cantidad de archivos que tiene. Aunque algunos costosos servicios de reconstrucción de datos pueden acercarse bastante ... a veces.

tsilb el

ahh, así es como recuerdas cual es cual! duh

Simon

7

Si. Si pierde solo una unidad en la matriz, pierde todo. Lo que significa que cualquier cosa en RAID 0 debe tener una copia de seguridad .

Josh
fuente

17

Incluso si usa algo que no sea RAID 0, debe tener copias de seguridad.

Juliano el

3

Sí, vea también: serverfault.com/questions/2888/why-is-raid-not-a-backup

ThatGraemeGuy el

@ Juliano, sí, tienes razón. Supongo que si tiene RAID 0, "¿realmente absolutamente realmente debe tener copias de seguridad"?

Josh el

2

Si no confía "realmente absolutamente realmente" en su copia de seguridad, entonces no es una copia de seguridad. El punto de respaldo es restaurar. Si no está probando eso y está seguro del éxito de la restauración, entonces no es una copia de seguridad.

Evan Anderson el

1

RAID no es una copia de seguridad. Cualquier cosa que no haya hecho una restauración de prueba no es una copia de seguridad. Cualquier cosa que sea vulnerable a las mismas cosas que su almacenamiento principal no es una copia de seguridad. Y sí, RAID0 fallará más que otro almacenamiento.

David Thornley el

6

Depende de para qué lo estés usando. Como otros han dicho, aproximadamente duplica el riesgo de falla de los datos que contiene en comparación con un solo disco. Si tenía 3 discos en la incursión 0, entonces 3 veces el riesgo, etc. Esto se debe a que pierde casi todos los datos si falla alguno de los discos. RAID funciona en un nivel bajo, por lo que generalmente no coloca un archivo en un disco y otro archivo en el otro disco , sino que generalmente divide el archivo entre los tantos discos.

Sin embargo, si tiene una copia de seguridad, y son datos estáticos, y el tiempo de actividad realmente no importa, entonces no es peligroso . Por ejemplo, podría usar la incursión 0 en una máquina de juego con mis archivos guardados en otro disco. De esta manera, las cargas de nivel serán rápidas :-) Pero para usos apropiados de TI, no es la opción ideal.

Una situación de TI sería máquinas redundantes con datos estáticos. En este caso, está bien que una máquina deje de funcionar por un tiempo.

Por último, los discos duros son mecánicos y se rompen con bastante frecuencia . Es posible que no vea esto si solo tiene un par de escritorios, pero con una sala de servidores y muchos discos, los reemplazará con bastante frecuencia.

Kyle Brandt
fuente

Soy relativamente nuevo aquí, y "serverfault" no está en mi diccionario, así que tengo que preguntar qué son estas cosas: "situación de serverfault", "usos apropiados de serverfault". ¿Es serverfault como ser un explorador o algo así? ¿Recibimos insignias? Siempre estamos preparados? Este lenguaje es extraño para mí.

labradort el

Oh, lo siento. Bueno, hay un superusuario para usuarios de escritorio y Serverfault para administradores de sistemas. Entonces, cuando dije servidor predeterminado, me refería a TI o a gran escala. Vea el enlace de preguntas frecuentes en la esquina superior derecha de esta página.

Kyle Brandt el

3

Sí lo es. tiene 2 discos, incursión 0: si uno falla, se pierden todos los datos. si no usa la incursión: si falla 1, se pierde el 50% de los datos ...

SI usa la incursión 1 - si falla 1 - tiene 0% de datos perdidos, pero paga dos veces por su Hardware .... :-)

Dani
fuente

3

Hablando de la experiencia personal de perder datos, definitivamente recomendaría que se ahorre los dolores de cabeza y evite RAID 0. Para cada unidad en la matriz, aumenta las posibilidades de perder todos los datos. Tenía 3 unidades en RAID 0 y la unidad central se rompió solo unos meses después, perdiendo casi 1 TB de datos.

Drarok
fuente

44

Mi experiencia ha sido que si una unidad falla, las otras también están a punto de desaparecer. Por lo tanto, no me preocupo tanto por RAID 0. Simplemente haga sus copias de seguridad. Perdí 2 unidades de una matriz RAID 5 de 4 unidades el mismo día, luego la reconstruí, perdí una tercera unidad original una semana más tarde ... Si es posible, evite unidades que tengan la misma edad, del mismo lote en matrices RAID ¿de cualquier tipo? :-)

Brian Knoblauch el

@Brian, ese es un gran punto al final. Tuvimos 17 unidades fallidas en varios de nuestros dispositivos SAN en el trabajo el mismo día. Todos tenían la misma edad y lote de dispositivos.

David Rickman el

@Brian Knoblauch: No entiendo completamente tu punto: ¿Cómo no preocuparte por RAID0 solo porque si una unidad falla, las otras pronto lo harán? Con RAID1, RAID5 o RAID10, si falla una unidad, no pierde datos. Con RAID0, pierde todos sus datos. No importa si las otras unidades están a punto de desaparecer ... Quiero decir, obviamente, importa en la medida en que planee reemplazar las otras pronto ... pero con RAID0, se pierde todo. Las otras unidades que funcionan pronto no tienen ningún efecto en eso.

Josh el

@ Josh: Creo que su punto es que necesitas copias de seguridad sin importar qué. Tenga en cuenta que perder dos unidades de RAID 5 también pierde datos, por lo que no es seguro. Dicho esto, parece que usar unidades de la misma edad en RAID 0 podría ser razonable, pero reemplace ambas si falla una unidad.

David Thornley el

1

No creo que Raid 0 sea arriesgado en absoluto. Personalmente ejecuto la incursión 0 para mi sistema operativo para la velocidad beneficiada. Podrías controlar mi configuración de ataque en cualquier momento de cualquier día y no perdería nada. Tengo mi sistema configurado correctamente, para obtener los beneficios de la velocidad y tener poca o ninguna pérdida de datos.

El único riesgo es para las personas que no saben cómo distribuir el riesgo.

Puedo decir lo anterior porque simplemente solo trabajo en archivos importantes en otra unidad que no sea la que se usa para mantener mi sistema operativo. Instalo aplicaciones y otras cosas en mi unidad principal del sistema operativo, pero sus archivos de configuración y demás están en una unidad secundaria. Esa unidad secundaria se duplica en otra unidad y luego realizo copias de seguridad semanales de esa unidad en una unidad externa. Si mi Raid 0 (OS Drive) fallara, simplemente saco el / los disco / s y pongo otro. Tome un Live CD de Linux y use un programa como dd o cat para copiar una imagen ya hecha en los discos Raid . Reinicio y ahora mi sistema está de vuelta a un estado prístino.

Recursividad
fuente

0

En el 99% de los casos, RAID-0 probablemente será una mala idea por todas las razones que otras personas han mencionado (mayor probabilidad de falla completa, etc.).

Sin embargo, se puede usar en algunas situaciones (más extremas), por ejemplo, en una gran variedad de servidores que trabajan juntos (a la google), donde las fallas individuales de la máquina no afectan críticamente el resultado final, pero RAID-0 es rápido y económico forma de ampliar la capacidad.

Pero para ser brutalmente honesto y no tratar de ser malo, pero si haces esa pregunta, no estarás en el último grupo de administradores de servidores :)

Cooperativas
fuente

0

¡Muchos chicos hablan de probabilidad y están equivocados! Si desea el riesgo de usar la incursión 0, así es como se calcula.

Suponga que la probabilidad de falla de hard1 es p1 (en nuestra unidad de período de tiempo) y hard2 es p2 cuando tiene un circuito en serie porque fallar uno lo romperá.

Entonces, para calcular el riesgo tenemos: riesgo = (1-p1) * (1-p2)

Por ejemplo, si las probabilidades de falla de hard1 y hard2 son .001, entonces el riesgo es: 0.998001

Entonces, como puede ver, la falla de 2 discos duros es casi igual a la probabilidad de 1 falla dura que no es demasiado alta.

Pero hay algo más aquí que cambia la situación y es que no puede recuperar archivos de discos duros incrustados demasiado fácilmente, de hecho, en mi experiencia, es imposible.

Ehsan.b
fuente

2

(1-p1) es la posibilidad de trabajar bien. Su multiplicación (1-p1) * (1-p2) es el cambio de ambos dispositivos funcionando bien.

kolypto el

1

Tarde o temprano cada unidad fallará. No es una cuestión de si sino cuándo. Por lo tanto, como no ha indicado un período de tiempo para que los cálculos sean significativos, la probabilidad solo puede ser del 100%.

1

Sin mencionar que, para bajas posibilidades de falla, la posibilidad de que uno de los dos discos falle es casi el doble de la probabilidad de uno. .999 no es casi lo mismo que .998001, si comienza a arriesgarse a fallar una y otra vez.

David Thornley el

3

Y las probabilidades no son independientes, ya que ambos discos son probablemente iguales y funcionan en el mismo entorno. Entonces no puedes simplemente multiplicar valores.

liori el

Creo que esta es solo la probabilidad de que ambos fracasen al mismo tiempo ...

ultrajohn

0

El factor de riesgo de usar un RAID 0 depende de lo que va a usar.

En cuanto a mi experiencia, comencé a usar RAID 0 hace un año usando 2 discos de bajo costo para mejorar el rendimiento en juegos y algo de edición de video y 1 disco duro grande para un almacenamiento simple. Mantengo todos mis datos importantes respaldados donde considero que son seguros.

¿Qué haré si uno (o ambos) discos mueren sobre mí? Tengo una imagen del SO con todos mis programas y controladores instalados, así que tiraré el disco defectuoso, usaré el otro hasta que muera como su hermano, compraré un par de nuevos y reconstruiré la matriz y procedo a dejar mi computadora como la quiero.

RiendoHombre
fuente

0

Creo que raid5 le dará algunos de los beneficios de raid0 y raid1, por lo que obtendrá una mayor velocidad y redundancia en comparación con el uso de un solo disco. Sin embargo, se necesitan tres discos como mínimo.

Fred
fuente

2

Tenga en cuenta que raid5 es bastante malo en escrituras aleatorias, ya que necesita hacer 3 IO (una lectura y dos escrituras) para actualizar un solo bloque aislado. Eso es peor que raid0 (una escritura) o raid1 (dos escrituras)

Capitán Segfault el

0

La teoría de la probabilidad dice que P1 es la probabilidad de falla del dispositivo 1 y P2: para el dispositivo 2, entonces la falla de cualquiera de ellos ocurre con la posibilidad de P1 + P2. Eso significa que las posibilidades de perder datos son realmente mayores, en realidad, dos veces mayores.

Prácticamente, tengo RAID 0, y no falla: los discos duros tienen 1-2 años garantizados de estabilidad, y a menudo funcionan bien durante este período. Puede monitorear sus parámetros SMART para asegurarse de que la matriz no falle de manera impredecible.

Creo que hoy en día los discos duros son la parte más lenta de la computadora. Al usar RAID 0 me di cuenta de que todo funciona MUCHO más rápido y que todo el sistema responde mejor: carga del sistema operativo, carga suave, etc. En realidad, ahora me estoy cansando cada vez que tengo que tocar sistemas sin RAID dentro :)

Sin embargo, como dijo Josh, debe hacer copias de seguridad. No solo cuando se usan RAID;)

Kolypto
fuente

2

Eso no es correcto Si ambos dispositivos tienen una probabilidad del 50% de fallar dentro de 5 años, no hay una probabilidad del 50% + 50% = 100% de que uno de ellos falle dentro de los 5 años.

Amok

No, eso es correcto. Aquí tenemos Probabilidad (FAIL-1 o FAIL-2), que en realidad es Probabilidad (FAIL-1) + Probabilidad (FAIL-2). Compruébalo: en.wikipedia.org/wiki/Probability#Mathematical_treatment

kolypto

3

No, esta mal. Lea sus propias fuentes nuevamente. No intentes incluir las matemáticas si no vas a prestarle atención.

Zac Thompson, el

2

"Los discos duros tienen 1-2 años garantizados de estabilidad". Si la unidad falla, se le compensará a prorrata por el tiempo restante de su garantía. NO se te compensará por los datos que acabas de perder. Además, SMART no evitará, ni necesariamente le advertirá, de una falla total y repentina de la unidad, como vemos con demasiada frecuencia. ¿Por qué correr riesgos con el componente más poco confiable en una computadora?

1

Un ejemplo aún mejor es, digamos, 80%. La probabilidad de falla obviamente no es 160%. La probabilidad de que falle cualquier unidad es P1 + P2 - P1 x P2, por lo que si ambos fueran 80%, la probabilidad general sería 96%. La probabilidad de que ambas unidades fallen es P1 x P2, que sería del 64% con este ejemplo (por lo que usar dos unidades es una mejora ; asegúrese de que sus posibilidades de algún tipo de pérdida de datos aumenten, pero la posibilidad de pérdida de un dato en particular es reducido ).

Pausado hasta nuevo aviso.

0

RAID 0 puede ser una gran solución en muchos casos donde el tiempo de inactividad no es crítico.

RAID le brinda velocidad, redundancia o ambas. RAID no es una solución de respaldo ya que solo protege contra fallas de hardware, solo un tipo de falla que puede causar pérdida de datos. Eso significa que debe tener una solución de respaldo implementada independientemente del tipo de RAID que use.

Independientemente del tipo de RAID que emplee, tendrá un rendimiento degradado en caso de falla del disco o reconstrucción de la matriz, y dado que en estos días los discos duros son cada vez más grandes y la velocidad está más o menos estancada, el tiempo de reconstrucción puede extenderse a días o incluso semanas. y crea estrés innecesario a los discos.

Personalmente prefiero ejecutar RAID 0, que en caso de falla del disco se restaurará de la copia de seguridad. Para mí, esa es la solución más rápida, más barata y menos estresante, ya que un poco de tiempo de inactividad no es realmente una preocupación.

Recuerde, cuando está reconstruyendo una matriz, cada bloque de datos se está leyendo / escribiendo en todos los discos, independientemente de la cantidad de datos útiles en los discos. En la práctica, eso generalmente se traduce en una reconstrucción de datos mucho más rápida a partir de la copia de seguridad en comparación con una reconstrucción RAID después de una falla del disco. Combinado con significativamente menos ciclos de escritura / lectura en el funcionamiento normal de RAID 0 en comparación con RAID 1/10 o RAID 5/6, se traducirá en menos fallas de disco en general.

Todo lo anterior es cierto si tiene una estrategia de copia de seguridad automática sólida, por ejemplo:

copia de seguridad continua en archivos calientes
copias de seguridad diarias en archivos fríos (ish)
copias de seguridad semanales en todos los archivos en medios ubicados de forma remota.

Para minimizar el tiempo de inactividad, incluso cuando se utiliza RAID 0, puede nivelar la copia de seguridad de datos activos en medios rápidos como SSD externo, ya que el conjunto de datos activos suele ser pequeño y las SSD externas son bastante baratas en estos días, y hacer copias de seguridad de datos fríos en medios lentos. La mayoría de los sistemas NAS comerciales, aunque sean baratos, podrán hacerlo por usted en estos días sin mucha molestia.

En los sistemas de misión crítica, todo lo anterior es irrelevante, ya que el tiempo de inactividad no es realmente una opción, pero aun así existen mejores soluciones, como la replicación de instantáneas en ZFS, brtfs o la codificación de borrado o la redundancia del servidor con sistemas de conmutación por error.

Marius P
fuente

¿RAID 0 es tan riesgoso como la gente dice que es?

Respuestas: