Si RAID5 / 6 son riesgosos debido a URE, ¿también están en riesgo los esquemas completos de copia de seguridad / restauración?

11

Según tengo entendido, tiene una alta probabilidad de encontrar un URE durante una reconstrucción debido a que tiene que leer una gran cantidad de datos para realizar la tarea.

¿Este problema también afecta a los escenarios de copia de seguridad y restauración de grandes cantidades de datos? Si tiene que hacer una restauración completa de una copia de seguridad de 10TB, las URE parecen igualmente probables.

Cowlby
fuente
3
Realmente no es un problema con RAID6 y RAID no está destinado a la copia de seguridad, sino a la disponibilidad.
user9517
Una copia de seguridad no es suficiente.
Restablece a Monica - M. Schröder el

Respuestas:

13

El verdadero problema con respecto a URE y RAID5 es que, al encontrar incluso un solo URE, muchos controladores de hardware simplemente abortan la reconstrucción de RAID y declaran la muerte de la matriz, poniendo todos sus datos fuera de línea. Si bien esta es la "apuesta más segura" con respecto a la posible corrupción de datos, no siempre es lo mejor que se puede hacer (por ejemplo: pensar en un URE que afecte a un sector de datos gratuito / no asignado por sistema de archivos. Aunque debería ser seguro ignorarlo) el controlador de hardware pondrá la matriz completa fuera de línea).

RAID6 es mucho menos propenso a URE, ya que la redundancia de dos discos realmente reduce la posibilidad de tener URE concurrentes en el mismo sector de disco / LBA.

Al mismo tiempo, el RAID de software (por ejemplo: mdadm) generalmente es mucho más flexible que el RAID de hardware, lo que permite la recuperación de la matriz RAID5 degradada incluso cuando se encuentran algunos URE.

Al restaurar desde una copia de seguridad, generalmente tiene herramientas más flexibles; Esto significa que, en el caso común, puede omitir los sectores dañados / ilegibles y continuar con la recuperación de otros datos.

shodanshok
fuente
3

Cualquier cosa en el volumen está en riesgo.

Si está declarando que tiene una preocupación con respecto a URE en un volumen / LUN que ha sufrido una falla de unidad RAID 5/6, entonces todos los datos en ese volumen estarían en riesgo.

Asegúrese de almacenar sus datos en un volumen / LUN diferente al que está almacenado su copia de seguridad. La mejor práctica indicaría que su copia de seguridad está en un dispositivo de almacenamiento completamente diferente al de sus datos de producción.

URE está típicamente en el nivel de bloque, por lo que cualquier cosa en ese volumen estaría en riesgo de corrupción. El formato de nivel de bloque es bajo en la pila. NTFS o VMFS (cualquier formato) va en el nivel de bloque y así sucesivamente. Dado que el nivel de bloque en el volumen RAID se encuentra debajo de todo, todos los datos se ven afectados por problemas a nivel de bloque.

Espero responder a su pregunta correctamente.

Ciudadano
fuente
3

En principio, sí, pero si almacena su copia de seguridad en un RAID6 (como ejemplo), tendrá el beneficio de la redundancia, por lo que la tasa de error total será mucho más baja y, con ello, la posibilidad de una URE durante la recuperación.

Si utiliza una solución de copia de seguridad en cinta, las tasas de error son mucho más bajas para comenzar (SAS: 1x10 ^ -15 - 1x10 ^ -16, LTO7: 1x10 ^ -19).

Sven
fuente