¿Cómo puedo ver los registros en un servidor después de un bloqueo de kernel panic?

10

Estoy ejecutando una máquina de producción gentoo Linux, y recientemente hubo una situación en la que el servidor se colgó en mis instalaciones compartidas y cuando llegué allí noté que el servidor estaba colgado de lo que parecía ser un bloqueo de kernel panic. Reinicié la máquina con un reinicio completo y me decepcionó descubrir que no podía encontrar una pizca de evidencia en ninguna parte sobre por qué la máquina se colgó.

¿Es cierto que cuando realizo un reinicio completo, los mensajes en sí se perderán o hay una configuración que puedo hacer en algún lugar decir en syslog-ng o tal vez en sysctl para al menos preservar el registro de errores para que pueda evitar que ocurran tales percances? en el futuro ? Por cierto, estoy ejecutando un kernel 2.6.x.

Gracias por adelantado.

Bajo Kian Seong
fuente

Respuestas:

5

Para registrar un kernel panic, usar netconsole es mucho más fácil que usar un enlace serial;)

Hay una entrada útil al respecto en ubuntu wiki que se puede usar en otros sabores de Linux ... Me ayudó, por ejemplo, con archlinux.

Tenga en cuenta que netconsole también se puede configurar en el arranque.

Vincent
fuente
4

En general, en estas situaciones, configuré una consola serie remota y luego me aseguré de registrar todo lo que aparece en la consola. Puede hacerlo conectando el puerto serie de la máquina a otra máquina mediante un cable rs-232. Esto podría ser un poco más complicado en estos días, ya que los puertos serie están desapareciendo gradualmente, pero creo que la mayoría de los servidores todavía los tienen.

Luego, en esa otra máquina, ejecute conserver y configure el registro de la consola. Esto proporciona una buena manera de registrar todo en la consola y proporcionar una ruta de inicio de sesión alternativa al sistema.

Si no desea configurar y administrar otra caja de Linux, una alternativa es instalar un servidor de consola en serie. Varias compañías como Avocent, Cyclades y Raritan fabrican estas cajas que proporcionan una interfaz de red a 2-48 puertos seriales. Sin embargo, este tipo de cosas será más costoso que simplemente configurar otra caja de Linux, por supuesto.

Phil Hollenback
fuente
44
Además de la respuesta de Phil, tenga en cuenta que muchos (¿la mayoría?) * Sistemas NIX volcarán el kernel / RAM en la partición de intercambio en caso de pánico, y copiarán el volcado al reinicio /var/crasho /var/adm/crashal reiniciarlo para permitirle atacarlo con un depurador y ver dónde tuvo lugar el pánico. Sin embargo, la consola serie sigue siendo una gran opción, ya que le permite ver qué fue lo último que hizo el servidor antes de hacerlo panic().
voretaq7
0

Puede intentar replicar mensajes de syslog en otra máquina. Tal vez no todos ellos, sino solo alertas y almacenamiento en caché crítico y deshabilitado para ellos.

dtoubelis
fuente