Tengo un servidor NAS con unidades de 4x 2TB WD RE4-GP en una configuración RAID10 (4TB utilizables). Me estoy quedando sin espacio (quedan <1 TB de espacio útil). Tengo $ 0 para gastar en unidades / gabinetes más grandes / más.
Me gusta lo que he leído sobre las características de integridad de datos de ZFS, que, por sí solas, son suficientes para que pueda cambiar mi RAID10 (software) XFS existente. Luego leí sobre la implementación superior de RAID5 de ZFS, así que pensé que incluso podría obtener hasta 2TB más de espacio utilizable en el negocio usando RAIDZ-1.
Sin embargo, sigo leyendo más y más publicaciones que dicen que simplemente nunca use RAIDZ-1. Solo RAIDZ-2 + es lo suficientemente confiable como para manejar fallas de disco del "mundo real". Por supuesto, en mi caso, RAIDZ-2 no tiene ningún sentido. Sería mucho mejor usar dos vdevs duplicados en un solo grupo (RAID10).
¿Estoy loco por querer usar RAIDZ-1 para unidades de 4x 2TB?
¿Debo usar un grupo de dos vdevs duplicados (esencialmente RAID10) y esperar que la compresión me dé suficiente espacio extra?
De cualquier manera, planeo usar compresión. Solo tengo 8 GB de RAM (máxima), por lo que dedup no es una opción.
Esto estará en un servidor FreeNAS (a punto de reemplazar el sistema operativo Ubuntu actual) para evitar los problemas de estabilidad de ZFS-on-Linux.
Respuestas:
Antes de entrar en detalles, considere su caso de uso. ¿Estás almacenando fotos, MP3 y DVD? Si es así, es posible que no le importe si pierde permanentemente un solo bloque de la matriz. Por otro lado, si se trata de datos importantes, esto podría ser un desastre.
La afirmación de que RAIDZ-1 "no es lo suficientemente bueno para fallas del mundo real" se debe a que es probable que tenga un error de medios latente en uno de sus discos supervivientes cuando llegue el momento de la reconstrucción. La misma lógica se aplica a RAID5.
ZFS mitiga esta falla hasta cierto punto. Si un dispositivo RAID5 no se puede reconstruir, no tienes suerte; copie sus datos (restantes) y reconstruya desde cero. Con ZFS, por otro lado, reconstruirá todo menos el fragmento defectuoso y permitirá al administrador "borrar" los errores. Perderá un archivo / porción de un archivo, pero no perderá toda la matriz. Y, por supuesto, la verificación de paridad de ZFS significa que se le informará de manera confiable que hay un error. De lo contrario, creo que es posible (aunque poco probable) que múltiples errores resulten en una reconstrucción aparentemente exitosa, pero que le devuelva datos incorrectos.
Dado que ZFS es una " Violación de capas desenfrenadas ", también sabe qué áreas no tienen datos sobre ellas y puede omitirlas en la reconstrucción. Entonces, si su matriz está medio vacía, es probable que tenga un error de reconstrucción.
Puede reducir la probabilidad de este tipo de errores de reconstrucción en cualquier nivel de RAID haciendo "scrubs zpool" o "comprobaciones mdadm" regulares de su matriz. Hay comandos / procesos similares para otros RAID; por ejemplo, las tarjetas de incursión LSI / dell PERC llaman a esto "lectura de patrulla". Estos van a leer todo, lo que puede ayudar a las unidades de disco a encontrar sectores defectuosos y reasignarlos, antes de que se vuelvan permanentes. Si son permanentes, el sistema RAID (ZFS / md / raid card / lo que sea) puede reconstruir los datos desde la paridad.
Incluso si usa RAIDZ2 o RAID6, los exfoliantes regulares son importantes.
Una nota final: RAID de cualquier tipo no es un sustituto de las copias de seguridad: no lo protegerá contra la eliminación accidental, el ransomware, etc. Aunque las instantáneas regulares de ZFS pueden ser parte de una estrategia de copia de seguridad.
fuente
Hay un pequeño concepto erróneo en el trabajo aquí. Muchos de los consejos que está viendo se basan en una suposición que puede no ser cierta. Específicamente, la tasa de error de bit irrecuperable de su unidad.
Un disco barato de "usuario doméstico" tiene una tasa de error irrecuperable de 1 por 10 ^ 14.
http://www.seagate.com/gb/en/internal-hard-drives/desktop-hard-drives/desktop-hdd/#specs
Esto está en un nivel en el que estás hablando de una probabilidad significativa de un error irrecuperable durante una reconstrucción RAID, por lo que no debes hacerlo. (Un cálculo rápido y sucio sugiere que 5x discos de 2TB RAID-5 realmente tendrán alrededor de un 60% de posibilidades de esto)
Sin embargo, esto no es cierto para unidades más caras: http://www.seagate.com/gb/en/internal-hard-drives/enterprise-hard-drives/hdd/enterprise-performance-15k-hdd/#specs
1 por 10 ^ 16 es 100 veces mejor, lo que significa que 5x 2 TB es <1% de probabilidad de reconstrucción fallida. (Probablemente menos, porque para uso empresarial, los husillos de 600 GB son generalmente más útiles).
Personalmente, creo que tanto RAID-5 como RAID-4 siguen siendo eminentemente utilizables, por todas las razones RAID-0 sigue siendo bastante común. No se olvide: el problema con RAID-6 es su fuerte penalización de escritura. Puede mitigar esto parcialmente con mucho almacenamiento en caché, pero aún tiene algo de dolor incorporado, especialmente cuando está trabajando con unidades lentas en primer lugar.
Y más fundamentalmente: NUNCA confíe nunca en su RAID para brindarle una capacidad de recuperación total. Perderá los datos con mayor frecuencia debido a un error que causa un fallo de la unidad, por lo que NECESITA una estrategia de respaldo decente si de todos modos se preocupa por sus datos.
fuente
Hmmm, alguna mala información aquí. Para 4 discos, realmente no hay nada malo con XFS. Tiendo a evitar ZFS RAIDZ por razones de rendimiento y capacidad de expansión (bajas lecturas / escrituras, no se pueden expandir). Use espejos ZFS si puede. Sin embargo, con 4 discos y ningún lugar para colocar su sistema operativo, perderá mucha capacidad o tendrá que pasar por juegos de partición extraños para ajustar su sistema operativo y datos en los mismos cuatro discos.
Probablemente no recomendaría ZFS para su caso de uso. No hay nada malo con XFS aquí.
fuente