Para fsck o no fsck después de 180 días

18

De manera predeterminada, después de 180 días o una cierta cantidad de montajes, la mayoría de los sistemas de archivos de Linux fuerzan una verificación del sistema de archivos (fsck). Por supuesto, esto se puede desactivar utilizando, por ejemplo, tune2fs -c 0 -i 0 en ext2 o ext3.

En sistemas de archivos pequeños, esta verificación es simplemente un inconveniente. Sin embargo, dados sistemas de archivos más grandes, esta verificación puede tardar horas y horas en completarse. Cuando sus usuarios dependen de este sistema de archivos para su productividad, digamos que está sirviendo sus directorios de inicio a través de NFS, ¿deshabilitaría la verificación programada del sistema de archivos?

¡Hago esta pregunta porque actualmente son las 2:15 am y estoy esperando un largo fsck para completar (ext3)!

Michael Havas
fuente

Respuestas:

13

El tiempo fsck predeterminado de 180 días es una solución para la falla de diseño que ext3 no admite una verificación de consistencia en línea. La solución real es encontrar un sistema de archivos que soporte esto. No sé si algún sistema de archivos maduro sí. Es una verdadera tragedia. Quizás btrfs nos salve algún día.

Respondí al problema del tiempo de inactividad sorpresa de varias horas de fsck haciendo reinicios programados con un fsck completo como parte del mantenimiento estándar. Esto es mejor que encontrarse con una corrupción menor durante las horas de producción y hacer que se convierta en una interrupción real.

Una gran parte del problema es que ext3 tiene un fsck irrazonablemente lento. Aunque xfs tiene un fsck mucho más rápido, usa demasiada memoria para distribuciones para alentar a xfs de manera predeterminada en sistemas de archivos grandes. Aún así, en la mayoría de los sistemas esto no es un problema. Cambiar a xfs permitiría al menos un fsck razonablemente rápido. Esto puede hacer que ejecutar fsck como parte del mantenimiento normal sea más fácil de programar.

Si está ejecutando RedHat y está considerando usar xfs, debe tener en cuenta cuán fuertemente desalientan el uso de xfs y el hecho de que probablemente haya pocas personas que usen xfs en el núcleo que está ejecutando.

Tengo entendido que el proyecto ext4 tiene el objetivo de mejorar al menos algo el rendimiento de fsck.

carlito
fuente
"Cambiar a xfs permitiría al menos un fsck razonablemente rápido" ... ¿Me perdí algo ?
Justin ᚅᚔᚈᚄᚒᚔ
4

Diría que esta es solo otra razón por la cual los servidores de producción no deben ejecutarse solos y siempre deben tener una copia de seguridad en frío / caliente o participar en un clúster de dos nodos. En estos días de virtualización, puede tener fácilmente un servidor principal físico y un servidor virtual, que es solo una copia del físico hecho cada X días, listo para hacerse cargo.

Aparte de esta respuesta no tan útil, diría que debe equilibrar la importancia de sus datos ... Si esto es solo un nodo de clúster, omítalo. Si este es un servidor web no respaldado de un cliente, es posible que desee planificar con anticipación la próxima vez :-)

Antoine Benkemoun
fuente
3

Depende ... Por ejemplo, tuvimos un servidor fuera de servicio para el mantenimiento de rutina que ejecutaba una pila QMail. QMail crea y mata muchos archivos a medida que pasa el tiempo, y era un servidor de correo muy ocupado. El fsck tardó unas 36 horas. No es que hayamos ahorrado una gran cantidad de rendimiento del acuerdo, pero en última instancia, supongo que se podría argumentar que el sistema de archivos era más saludable. ¿Realmente valió la pena el caos que siguió? No. A. Todos.

f4nt
fuente
44
Además, estoy seguro de que también lo sabe, pero el apagado -f omitirá fsck al reiniciar.
Artem Russakovskii
Sí, en retrospectiva 20/20 así eh? :)
f4nt
0

XFS es interesante. Es un FS siempre consistente. No necesita fsck. No causará tiempo de inactividad debido a fsck.

Pero tiene otro problema. Necesita un controlador RAID con soporte para tratar con bloques defectuosos de HDD.

XFS no tiene la función de poner en la lista negra los bloques defectuosos cuando el sistema operativo comienza a conocer los bloques defectuosos y la lista de bloques defectuosos del hardware del HDD está llena.

ext2 / 3/4, fat, ntfs, etc. (prueba fuera de línea) pueden poner en la lista negra los bloques defectuosos pero no XFS.

Entonces, para instalaciones no empresariales, XFS probablemente no se adapte bien. Estoy usando XFS con el software linux raid1 para particiones de respaldo donde el contenido es muchos archivos pequeños con poco cambio a lo largo del tiempo.

Jose Tavares
fuente