Tengo algunos problemas con un servidor Dell 1950. Estoy instalando RHEL 4.6 junto con Oracle y algún otro software aquí.
Recibo un mensaje de error al azar que dice "kernel: journal commit I / O error" en mi sesión ssh y en el monitor que he conectado al servidor. Veo un error que dice "Error EXT3-fs (dispositivo sda5) en start_transaction: el diario ha abortado ".
Ha sucedido varias veces, pero nunca en el mismo punto durante la instalación. En realidad, esta última vez el sistema estaba en funcionamiento y solo estaba tratando de importar una base de datos a Oracle.
Esto ha sucedido en varios discos duros, así que estoy bastante seguro de que ese no es el problema. Esto me hace pensar que el controlador de banda está yendo mal.
¿Qué piensan ustedes?
** ACTUALIZACIÓN **
Estoy bastante seguro de que era un mal disco duro. Lancé otra unidad en el servidor y ha estado funcionando durante aproximadamente 48 horas sin problemas.
Podría ser que el controlador RAID se dañe como dijo (pruebe un repuesto si tiene uno). Podría ser el controlador del controlador (verifique si hay controladores alternativos si están disponibles, incluso si el rendimiento es peor, es bueno tener un punto de referencia .) Podría ser el núcleo (aunque es menos probable que en RHEL, esté bastante bien probado.) Podría ser una RAM defectuosa que estropee el caché de bloques.
Sin embargo, un problema de hardware es la causa más probable, según el comportamiento de error aparentemente aleatorio.
fuente
Verifique que el disco no esté lleno, en particular la partición raíz. Use df para ver el uso del disco del sistema de archivos:
Busque particiones cercanas o iguales al 100% de utilización
fuente
tratar:
apagado -rF ahora
fuente