Ubuntu 12.04 se congeló, requiriendo powercycle. ¿Qué debo buscar / grep en los registros?

8

Esta no es la primera vez que Ubuntu se congela. La última vez, he comprobado 'archivos actualizados recientemente en' /var/log/e /var/crash/y la causa del problema parecía ser 'LibreOffice'.

Ahora, ha sucedido de nuevo.

Nada funciona, excepto el botón de apagado (basado en la experiencia previa). Ni siquiera puedo abrir tty's usandoCtrl+Alt+F{1..6}

Tengo mucha memoria (7.7 GB), Ram (2 x 3.16Ghz) y espacio en el disco duro (100 GB en un SSD de 256GB).

No hay nada que pueda hacer, excepto cerrar. La computadora pasó una prueba de memoria.

¿Qué debo buscar (grep) en los registros?

Actualización: He enviado un error aquí: https://bugs.launchpad.net/ubuntu/+source/xorg/+bug/1023916/

Abe
fuente
Duplicado exacto aquí: askubuntu.com/questions/4408/…
Tom Brossman
1
@TomBrossman pregunta similar, excepto que todas las respuestas suponen alguna respuesta. La [respuesta más cercana] (solo tendrá que encender y apagar la máquina. Que nunca llegue a este punto) toca este caso muy brevemente al final "solo tendrá que encender y apagar la máquina. nunca llegue a este punto ". Eso no me ayuda a prevenir la próxima ocurrencia.
Abe
1
@TomBrossman He actualizado la pregunta para que sea más específica
Abe

Respuestas:

2

Un congelamiento se parece mucho a un error en Xorg o en el kernel. ¿Has tratado de pasar a la caja? A veces eso funciona incluso si las interfaces de usuario locales son irresponsables. Una conexión ssh que funcione podría ser muy útil para depurar este tipo de problema.

De los datos que proporcionó, iría por el registro del kernel. Parece que la oficina libre colapsó por alguna razón, y en un segundo, Chrome también desapareció. Entonces definitivamente había algún tipo de problema en ese momento. Eche un vistazo más de cerca al registro alrededor de esas líneas de error y vea si puede identificar el primer mensaje de error de esa cascada de eventos. Las marcas de tiempo a la izquierda deberían ser útiles, ya que cualquier evento relacionado con el congelamiento debería estar bastante cerca de los dos que mencioné.

Solo a juzgar por los dos eventos incluidos en su registro, parece probable que el bloqueo de la oficina libre de alguna manera hizo que X fuera inestable, causando tanto el congelamiento de la IU como el bloqueo del cromo. Notarás que Chrome se bloqueó en una biblioteca X.

MvG
fuente
1
De hecho, puedo meterme en la caja. ¿Qué sigue?
Abe
Echa un vistazo a /var/log/Xorg.0.log. Ejecute dmesgpara ver la salida reciente del kernel. Quizás ejecutar pstreey / o ps -Aver qué procesos aún existen. Después de eso, puede decidir recopilar más información o ver si puede reiniciar su servidor X. El último es sudo restart lightdmiirc, pero podría estar equivocado allí.
MvG
Bueno. Después de encontrar algunos bits en los foros de ubuntu sobre el mensaje "Xorg Tainted P" /var/log/kern.log, me di cuenta de que no había reinstalado el controlador ATI propietario después de actualizar a 12.04, y que este podría ser el problema. Así que he reinstalado el controlador ATI. Por cierto, /var/log/Xorg.0.logtenía> 1000 líneas de largo, todo desde hoy, así que ni siquiera sabía por dónde empezar. Gracias por la ayuda. Te dejaré saber lo que encuentre.
Abe
No, la instalación del controlador propietario no lo solucionó.
Abe
1
Bueno. Ya he reiniciado; pero cuando ocurra la próxima vez (tenga en cuenta lo siguiente :) aquí están las instrucciones para informar un "Error de bloqueo de GPU" wiki.ubuntu.com/X/Troubleshooting/Freeze
Abe
0

Estaba ejecutando en el modo predeterminado 'vainilla', aunque tengo instalado xfce y kde.

Una instalación de vainilla, a mi entender, significa una instalación limpia de una distribución. Pruebe una instalación limpia (como formatear todo , cree un nuevo usuario e intente nuevamente). Por supuesto, haga una copia de seguridad de sus archivos importantes antes de hacer esto.

Además, en lugar de reinstalar, puede intentar crear un nuevo usuario . Esto puede señalar el problema: si el nuevo usuario funciona, el problema se encuentra en la configuración de usuario doméstico. Si no es así, es un problema del sistema (y reinstalarlo probablemente lo resolvería)

No instales nada más. No use PPA. Solo actualice el software a través del administrador de actualizaciones o apt-get, sin alterar / agregar la lista sources.list. Eso significa instalación de vainilla. Vea cómo responde el sistema durante 3-4 días. Luego, comience a agregar software uno por uno para descubrir el paquete problemático.

Después de reiniciar, el sistema generalmente agrega ".old" o ".0" en el nombre del archivo.

Yo diría que estos archivos de registro serían informativos:

tar czf mylogs.tar.gz --ignore-failed-read ~/.xsession-errors.old /var/log/Xorg.0.log.old /var/log/dmesg.0 /var/log/syslog.1 /var/log/kern.log.1 /var/log/apport.log.1 /var/log/pm-powersave.log.1
file-roller mylogs.tar.gz

... o si lo prefiere por separado:

cat ~/.xsession-errors.old
cat /var/log/Xorg.0.log.old
cat /var/log/dmesg.0
cat /var/log/syslog.1
cat /var/log/kern.log.1
cat /var/log/apport.log.1
cat /var/log/pm-powersave.log.1
Savvas Radevic
fuente
Me refería a "modo vainilla" como al seleccionar "ubuntu" en lugar de "gnome classic", "ubuntu 2D", "xubuntu", etc. al iniciar sesión, en lugar de una "instalación vainilla". No estoy seguro de qué más llamarlo. Pero intentaré depurar más antes de volver a instalar.
Abe
¿Sería útil publicar todos estos registros? Si es así, ¿cómo puedo eliminar los datos privados?
Abe
No sé si ayudaría a alguien, ciertamente no a mí. Tal vez alguien estaría dispuesto a mirar los registros. No sé cómo borrar los datos privados de los registros, puede examinar cada uno y decidir por sí mismo, en función de sus niveles de privacidad y preocupaciones. ¿Por qué no intentas crear un nuevo usuario ? Si el nuevo usuario funciona, el problema se encuentra en la configuración de usuario doméstico. Si no es así, es un problema del sistema (y la reinstalación lo resolvería probablemente)
Savvas Radevic
0

Varias aplicaciones segfault y kernel oops generalmente son síntomas de problemas de hardware. Primero intente ejecutar un memtest, probablemente fallará con errores.

Giovanni Toraldo
fuente
Ya ejecuté un memtest y aprobé, pero ese es obviamente un enfoque útil para intentar. He editado mi pregunta para agregar esta información.
Abe