¿Raid 1 protege contra la corrupción de datos? Por ejemplo, supongamos que guardo todos mis archivos importantes en un NAS que usa 2 discos en un RAID 1. Si un disco duro tiene algún tipo de problema interno y los datos se corrompen, ¿el RAID lo reconoce automáticamente y lo corrige? Está utilizando datos del otro disco bueno?
¿Podría incluso saber qué copia es la buena?
¿RAID 5 protege contra la corrupción?
Sé que RAID no es una solución de respaldo. ¡Estoy tratando de descubrir cómo asegurarme de que no estoy haciendo una copia de seguridad de los datos corruptos!
fuente
Como otros han señalado, un sistema raid1 no tiene forma de saber cuál de los dos sectores es malo.
Los sistemas de incursión de extremo superior ejecutan una operación de limpieza en segundo plano para comparar ambas copias y marcar las diferencias. Mejor aún es un sistema que lee ambos bloques del disco cada vez y los compara en el momento de la lectura. Sin embargo, resolver esas diferencias es imposible para el controlador de banda.
En sistemas Unix con mdadm, se puede iniciar una comprobación de depuración con "sync_action":
raid1 se trata de proteger de una falla total repentina de la unidad. Busque en otro lugar protección contra la corrupción. Más allá de eso, Raid1 no ofrece "historial", por lo que no puede recuperarse de un error humano o de software. Busque sistemas de archivos como ZFS o un sistema de archivos que conserve el historial como Hammer para protegerse contra la corrupción.
fuente
En la práctica, sí. La gran mayoría de las fallas del disco duro ocurren de forma total o nula. O bien (a) el cable está desenchufado o el microcontrolador de la unidad ha fallado, por lo que el controlador RAID no obtiene ninguna respuesta, obviamente, la unidad ha fallado. O (b) El cable y el microcontrolador de la unidad son buenos, pero cuando intenta leer un sector, el microcontrolador de la unidad interna detecta la corrupción de los datos porque la suma de comprobación de ECC interna falló y repetidos intentos de leer ese sector (en caso de que sea un error de lectura temporal ) finalmente se agota el tiempo de espera, por lo que el controlador RAID obtiene una respuesta cortés de "perdón": disco obvio que falla. De cualquier manera, es obvio para el controlador RAID-1 o RAID-5 que la unidad ha fallado.
En principio, no. Si algo ha salido tan mal que un disco duro no tiene sentido y, de alguna manera, funciona lo suficientemente bien como para escribir el código ECC interno correcto para ese sinsentido, entonces RAID-1 no puede determinar qué unidad es correcta. El sistema RAID-1 probablemente sobrescribirá los datos correctos con los datos corruptos en una resincronización. RAID-5 no es mejor. La falla de energía del "agujero de escritura RAID-5" durante la escritura activa es un caso particular, raro pero no imposible.
Hasta donde sé, la única forma de evitar dicha corrupción es usar sumas de verificación de extremo a extremo además de la duplicación de archivos, ya sea automáticamente como parte del sistema de archivos (ZFS o Btrfs) o periódicamente o manualmente (recalculando las sumas de verificación rsync, verificación simple de archivos, conjuntos de archivos Parchive, etc.); idealmente con un hash criptográfico como SHA-256.
fuente