"El sistema se está apagando para reiniciar ahora"

13

Estoy conectado a un beagleboard a través de tty y de repente veo este mensaje:

Broadcast message from root@arm
        (unknown) at 11:40 ...

The system is going down for reboot NOW!
[  143.036193] Restarting system.

El sistema es Ubuntu 12.10. ¿Hay algún lugar donde pueda encontrar por qué el sistema decidió fallar?

ACTUALIZACIÓN: Más información

  • Esto realmente sucede todo el tiempo, el tablero se reinicia cada 1 a 5 minutos.
  • Me aseguré de que ningún programa o demonio se ejecute al inicio.
  • No puedo encontrar Restartingningún lugar en ningún archivo en/var/log
  • En syslogantes de un reinicio no es consistentemente unaFeb 10 09:20:00 arm rsyslogd: [origin software="rsyslogd" swVersion="5.8.6" x-pid="317" x-info="http://www.rsyslog.com"] exiting on signal 15.
Thomas
fuente
@ JMCF125 He actualizado mi pregunta con más información
Thomas
Resulta que rsyslogdes simplemente el demonio que da esos mensajes ... Tal vez tienes un raro malware de Linux ... 1 a 5 minutos es poco tiempo, intenta insertar un Live CD y obtén más información. Si no obtiene nada, le aconsejaría que reinstale, posiblemente otra distribución.
JMCF125
Al principio estaba pensando en un problema físico en el tablero como el voltaje eléctrico bajando demasiado, pero dado que el sistema lo sabría?
Thomas
Si el problema fuera la alimentación, con el Live CD sucedería lo mismo.
JMCF125

Respuestas:

11

La forma en que rastrearía esto es reemplazar las utilidades halty shutdowncon un script.

Primero cree un script como el siguiente en /bin/fakehalt:

#!/bin/bash
exec >>/tmp/fakehalt.log 2>&1
date
echo "CMD=$0 PID=$$"
ps -ef --forest
echo '========'

Luego instálelo con:

chmod a+x /bin/fakehalt
mv /sbin/halt /sbin/halt.orig
ln -s /bin/fakehalt /sbin/halt
mv /sbin/shutdown /sbin/shutdown.orig
ln -s /bin/fakehalt /sbin/shutdown

Esto creará un archivo de registro /tmp/fakehalt.logcada vez que se llame. Registrará el nombre que recibió como ( halto shutdown) su propio PID, y luego un diagrama de árbol de todos los procesos en ese momento.

Esto debería darle toda la información necesaria para rastrearlo. Solo mira a través del psárbol y encuentra lo que se llama el guión.


/sbin/rebootdebería ser un enlace simbólico a /sbin/halt. Si no es así, reemplácelo también.


Si esto aún no lo captura, reemplácelo /sbin/inittambién (ya que también se puede usar para reiniciar el sistema). Pero esto es peligroso, ya que si el sistema se reinicia, no funcionará correctamente.

Patricio
fuente
Me gusta su solución, la he probado y me ayudó a encontrar el problema (un trabajo en fcron dejado por otra persona que cerró a propósito cuando un cheque era falso)
Thomas
1
@Thomas Mencionaste anteriormente que fcronestaba vacío, solo te preguntabas por qué no se mostraba la tarea, ¿puedes verla ahora?
X Tian
@XTian error humano, busqué cron pero no fcron
Thomas
@Thomas, por cierto, ¿por qué había un trabajo fcronpara cerrar?
JMCF125
1
@ JMCF125 Sí, fue el caso (problemas de desconexión USB de Beagleboard) y me llevó a leer hilos de grupos de Google muy largos. Fue mi error con el fcron, este fue un fuego falso. De alguna manera, el script en fcron dice "reiniciar" y es por eso que hay un mensaje más amplio en kern.log. Gracias por seguir
Thomas
3

Ejecute su kernel con algo así init=/bin/bash. Esto debería hacer que no se estén ejecutando procesos que este shell.

Verifique que ya haya un problema de reinicio.

A continuación, averigüe qué sistema de inicio utiliza normalmente y eche un vistazo a todos los servicios que inicia.

Intente deshabilitar los servicios hasta que desaparezca el problema de reinicio.

michas
fuente
en que archivo escribes init=/bin/bash?
Thomas
Esto depende de su gestor de arranque. (grub, syslinux, etc.) Por lo general, su gestor de arranque debería brindarle una forma interactiva de elegir su núcleo y agregar parámetros adicionales. También tiene algún archivo de configuración (generalmente en / boot) para agregar parámetros permanentemente.
michas
2

Bueno, es una de estas posibilidades.

  • Alguien está cerrando
  • cron está ejecutando el apagado (o ha comenzado algo que está ejecutando el apagado)
  • La administración de energía desencadena un apagado (sin encendido, hibernación, suspensión o sistema inactivo, se presiona el botón de hardware de encendido)
  • reinicio solicitado después de la instalación del paquete
X Tian
fuente
Desafortunadamente, cron y fcron están vacíos, y yo soy el único conectado a la placa, nadie está cerrando el sistema
Thomas
El OP dice: «Me aseguré de que ningún programa o demonio se ejecute al inicio». Y dudo que alguien haya pirateado su computadora para apagarla de vez en cuando. Quizás sea otra cosa.
JMCF125
Busque shut (caso independiente no reiniciando) en var / log / *
X Tian
no hay resultado para "shut"
Thomas