Me gustaría saber, por parte de personas más experimentadas, cuál sería la mejor opción de sistema de archivos para un servidor de archivos con más de 20 TB de discos duros. Personalmente, siempre usé EXT3 (en aquellos días) y EXT4 (desde que estaba disponible) [y una vez ReiserFS 3, aunque causó muchos daños en los datos] en mis computadoras personales y en los discos BOOT y ROOT de "pequeños servidores".
Sin embargo, como las herramientas EXT4 (aunque no EXT4 en sí) están limitadas a particiones de 16 TB, esta puede no ser mi mejor opción. La distribución será Debian 6.0 (Squeeze) y / o Gentoo (última versión), por lo que el núcleo debe ser bastante reciente (en Debian al menos con backports), lo que significa kernel de Linux> = 2.6.32.
El servidor de archivos se utilizará para tres propósitos principales (y también para particiones separadas, porque el propósito es mantener los datos "seguros" y realmente no les importa mucho la sobrecarga). Sin embargo, todos los discos deben cifrarse con LUKS :
- Medios, descargas y repositorio local de Debian [Tengo al menos 6 máquinas que ejecutan Debian]> 20 TB (tal vez una mayor separación entre Medios, Descargas y el repositorio de Debian)
- Datos (documentos, fotos, ...) ~ 4TB SAFE (es decir, raid1 o raid6 + disco de respaldo)
- Copias de seguridad> = 20 TB para copias de seguridad de otras computadoras en mi gigabit lan (¿puede sugerir un software que haga una copia de seguridad de todo el sistema operativo incluso si es Windows, BackupPC dice que lo hace, alguna alternativa?)
Las velocidades rápidas no son realmente necesarias (accesos concurrentes: máximo de 2 o 3 archivos grandes, digamos videos), incluso si son "solo" lecturas de 200 MB / s de un 10 HDD Raid6, puedo vivir con eso.
En resumen, busco un sistema de archivos confiable, escalable (es decir, fácilmente expandible) que admita más de 20 TB / partición. Cuanto más seguro y confiable sea el FS, mejor. El hardware empleado será al menos de cuatro núcleos (amd x4 630 o intel i5-2500k) y mucha RAM (> 8 GB, quizás> 16 GB), por lo que se deben cumplir los requisitos de hardware.
Mis PC / Servidor se conectarán a un UPS (fuente de alimentación ininterrumpida) en caso de corte de energía. También podrían hacer copias de seguridad y medios en máquinas separadas (es decir, dos servidores).
fuente
Respuestas:
Mucha gente sugiere ZFS. Pero ZFS no está disponible de forma nativa en Linux, excepto a través de fusibles. No recomendaría esto para su situación en la que es probable que el rendimiento sea importante.
Desafortunadamente, ZFS nunca estará disponible como un módulo de kernel nativo a menos que los problemas de licencia se resuelvan de alguna manera.
XFS es bueno, pero algunas personas han reportado problemas de corrupción y realmente no puedo comentar sobre eso. Jugué con pequeñas particiones XFS y no tuve estos problemas pero no en producción.
Sin embargo, ZFS tiene muchas ventajas y características útiles que no se pueden ignorar. En resumen, son (ver ZFS Wiki para una descripción completa de lo que significan):
Entonces, ¿cómo lo solucionamos? Mi alternativa sugerida que puede adaptarse a su situación es considerar nexenta . Este es un kernel de Open Solaris con herramientas GNU userland ejecutándose en la parte superior. Tener un núcleo Open Solaris significa tener ZFS disponible de forma nativa.
fuente
Debería probar XFS, ajustarse bien a sus requisitos:
fuente
Su opción más fácil es usar XFS. Muchas de las malas experiencias en torno a XFS se basan en versiones antiguas y problemas de hardware de escritorio que no creo que sean realmente relevantes para nuevas implementaciones en hardware de servidor de calidad estándar. Escribí una publicación de blog sobre este tema que puede ayudarlo a resolver la situación actual. Hay varias instalaciones de bases de datos XFS ocupadas con cientos de usuarios y terabytes de datos que ayudo a administrar. Todos están en el núcleo de Debian Lenny (2.6.26) o posterior y no he escuchado ningún indicio de problemas con ellos en años. No usaría XFS con ningún kernel anterior a ese. He escuchado algunos informes directos de personas que todavía ven un comportamiento extraño de XFS cuando el sistema se queda sin memoria o espacio en disco; Sin embargo, todavía no lo he visto.
La única otra opción razonable es usar ext4 con alguna piratería para admitir sistemas de archivos más grandes. No esperaría que tuviera un nivel de confiabilidad muy diferente. He tenido que recuperar datos de múltiples sistemas ext4 rotos que se encontraron con errores del kernel, hasta ahora todos arreglados en sentido ascendente pero no en el kernel del distribuidor en ese momento. ext4 tiene su propio conjunto de problemas de metadatos como pérdida de datos de asignación retrasada , cosas que tenían menos probabilidades de suceder en ext3. Yo estimaría que las probabilidades de que usted golpee un error ext4 sería aún mayor de lo normal si lo está forzando por encima del límite de tamaño normal, simplemente porque parece más probable que esté golpeando una nueva ruta de código menos probada en algún momento .
La idea alternativa es usar ext3 más seguro y aburrido, aceptar el límite de 16 TB y dividir las cosas mejor para que ningún sistema de archivos tenga que ser tan grande.
Un extremo suelto relacionado con los problemas de la revista. No habló sobre cómo se conectarán todas estas unidades. Asegúrese de comprender la implicación de cualquier almacenamiento en caché de escritura que esté en su cadena de almacenamiento aquí. Deshabilítelo o asegúrese de que el sistema de archivos esté vaciando el caché. He guardado algunos recursos sobre eso en Escrituras confiables si eso no es algo que estás revisando todavía.
Las unidades apestan. Las matrices RAID apestan. Los sistemas de archivos apestan. Múltiples fallas suceden. Me alegra ver que ya estás pensando en copias de seguridad; pasar de buena a gran confiabilidad en el almacenamiento requiere más que solo RAID y algunas unidades de repuesto. La redundancia cuesta algo en todos los niveles, y el dinero para el hardware frente a la complejidad del software es difícil de navegar. Y observa tus expectativas de rendimiento. Si bien una matriz RAID como la que está considerando generará fácilmente cientos de MB / s, todo lo que necesita son dos lectores simultáneos que buscan constantemente el disco para soltarlo en unos pocos MB / s. Puedo aplastar fácilmente una matriz RAID10 de 24 discos de modo que solo entregue <5 MB / s contra una carga de trabajo de referencia . Una cosa que ayuda allí es asegurarse de ajustar el lector de lectura hacia arriba si es posible tener múltiples lectores de transmisión.
fuente
La implementación en ZFS usando FreeBSD podría ocurrir aquí usando gbde para el cifrado. ZFS mismo sería el proveedor de software RAID, a través de RAIDZ . La complejidad de la gestión de almacenamiento de la construcción de zpools no es significativamente diferente de lo que Linux le hará pasar con mdadm, y en algunos casos en realidad será más fácil. Mi primera instalación de ZFS (en Solaris 10 hace unos 3 años) tenía un sistema de archivos de 17 TB en 48 unidades. Sobreviví a múltiples fallas allí sin problemas, aprendiendo administración de ZFS a medida que avanzaba.
La ventaja principal es que la suma de comprobación de ZFS proporciona una mejor detección de errores que Linux, lo que es una defensa contra el hardware defectuoso que vale la pena considerar. Las principales desventajas son que FreeBSD es menos popular. Aún no sabe cómo administrarlo, el soporte de hardware es un poco más débil que Linux, y dado que es una plataforma menos popular, no hay tanta gente para pedir ayuda si tiene problemas.
Sin embargo, una matriz de almacenamiento de muchos terabytes realmente destaca en qué es bueno ZFS. Vale la pena considerarlo seriamente si está dispuesto a lanzarse a algo nuevo. Si desea explorar la verdadera paranoia de respaldo, cree servidores de respaldo de Linux y FreeBSD, para reducir las probabilidades de errores del sistema operativo como un solo punto de falla.
fuente
De acuerdo con la página de comparación del sistema de archivos de Wikipedia , hay muchos sistemas de archivos notables que se adaptan a sus necesidades, como JFS, XFS, UDF, ZFS, GPFS y Btrfs. Simplemente haga clic en el tamaño máximo de archivo para ordenar y seleccionar el más apropiado
fuente