¿Cómo puedo depurar heladas frecuentes irrecuperables?

9

Mi nuevo XPS 13 (9360 con procesador KabyLake) con Ubuntu 16.04 preinstalado con frecuencia se congela por completo sin ninguna razón aparente.

Las congelaciones ocurren aparentemente al azar. A veces, el puntero del mouse todavía se puede mover durante unos segundos, pero finalmente el sistema se bloquea por completo. No puedo cambiar a terminales virtuales y ni siquiera los códigos SysRq parecen tener ningún efecto. Todo lo que puedo hacer es presionar prolongadamente el botón de encendido para apagarlo y luego el sistema arranca normalmente.

Los procesos de usuario que se ejecutan son principalmente varias pestañas de Chrome y un terminal.

Las cosas que he comprobado e intentado incluyen:

Después de hacerlo, todavía se producen congelaciones. Ahora estoy perdido. Mi pregunta así es:

¿Cuáles son las formas de encontrar la causa del problema?

justfortherec
fuente
Esto suena como un error de estado que existía con las CPU Bay-Trail. Supongo que vale la pena intentarlo también. Reinicie su máquina hasta que vea las grubopciones de arranque. Haga clic epara abrir las opciones de la línea de comandos. Luego, agregue intel_idle.max_cstate=1justo después de las palabras quiet splashy arranque. A ver si esto funciona. Es posible que deba presentar un error en Launchpad. Que núcleo esta usando?
negusp
@PatrickNegus Esto es con el kernel 4.4.0-47-generic. Hay una opción de BIOS para deshabilitar los estados C. ¿Eso esencialmente hace lo mismo? Intentaré editar la línea de comandos. Con "un error cstate que existía con la CPU Bay-Trail", ¿quiere decir un error del núcleo o un error de hardware? ¿Vale la pena probar los núcleos mainline más nuevos?
justfortherec
Kernel 4.8 tiene mucho, mucho mejor soporte para Kaby Lake que 4.4. Entonces sí, por favor actualice. Con respecto al error Bay-Trail, fue y sigue siendo un error del kernel que impide que Ubuntu pueda administrar eficazmente los estados de suspensión de la CPU (lo que ahorra energía para la CPU y brinda una eficiencia inactiva mucho mejor).
negusp
Gracias por tu ayuda, @PatrickNegus. Solo para verificar que queremos decir lo mismo. ¿Quiere decir actualizar al núcleo de 16.10 como se describe en askubuntu.com/a/840184/63018 ?
justfortherec
Sí, a eso me refería.
negusp

Respuestas:

4

Desactivar intel_cstates(estados de ahorro de energía destinadas a reducir el calor residual de la CPU y el consumo de energía) mediante la edición /etc/default/grub:

sudo nano /etc/default/grub

Encuentra la línea que contiene GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"

Añadir intel_idle.max_cstate=1directamente siguiente splash.

Alternativamente, si su BIOS admite hacerlo, desactive dichos estados C desde allí.

Nota: esto no es una solución a largo plazo. La desactivación de los estados C aumenta en gran medida el consumo de energía y el calor residual. ¡Solo intente esto si no hay otras soluciones y actualizar su núcleo no resuelve nada!

negusp
fuente
¿Por qué exactamente esto ayudaría?
Korijn
@Korijn ... ha pasado un tiempo, pero ha habido (o posiblemente se resolvió) un error con las CPU Intel Bay Trail en el que hay una inestabilidad significativa en el sistema cuando se habilitan los estados de ahorro de energía. Deshabilitar c-states corrige el error.
negusp
3

Cómo instalar Kernel 4.8.5

Aunque 4.8.7 es el kernel más reciente, en este registro de errores de 500 publicaciones y 1 año de duración ( Bug 109051 - intel_idle.max_cstate = 1 requerido en baytrail para evitar bloqueos ) se informa que no funciona. Justo ayer alguien publicó que lo probaron 4.8.7, se estrelló y volvieron a 4.8.6.

Aunque el título del registro de errores es para "Bay Trail", las soluciones presentadas se aplican a otras plataformas Intel según informan los usuarios. Debido a que hay 582 publicaciones que abarcan casi un año, recomiendo presionar la Endtecla después de abrir el enlace y desplazarse hacia arriba desde allí.

He estado ejecutando 4.8.5 de vez en cuando junto con 4.4.0-47 durante un par de semanas y me siento cómodo usando cualquiera de los dos. Estas son las instrucciones para instalar la versión del kernel 4.8.5:

cd /tmp
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-headers-4.8.5-040805_4.8.5-040805.201610280434_all.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-headers-4.8.5-040805-generic_4.8.5-040805.201610280434_amd64.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-image-4.8.5-040805-generic_4.8.5-040805.201610280434_amd64.deb
sudo dpkg -i *.deb
sudo reboot

Puede instalar cualquier núcleo visitando el sitio: ( http://kernel.ubuntu.com/~kernel-ppa/mainline/ ) y adaptando los enlaces a las instrucciones anteriores.

WinEunuuchs2Unix
fuente
Gracias por la info. Sin embargo, no lo aceptaré como la respuesta a este tema, porque aborda una pregunta que planteé en el comentario, no la pregunta original de este hilo.
justfortherec
En efecto. Avíseme si prueba un nuevo núcleo y si funciona.
WinEunuuchs2Unix
2
Mi sistema se detuvo para congelarse aleatoriamente después de actualizar a cualquier kernel 4.8 que he probado (LTS 4.8.0-25.27~16.04.1y mainline 4.8.12-040812.201612020431).
justfortherec