Kernel: Uhhuh. NMI recibido por razón desconocida 31 en la CPU 3

8

Recibo este error en "Linux Debian-70-wheezy-64-minimal 3.2.0-4-amd64 # 1 SMP Debian 3.2.46-1 + deb7u1 x86_64":

Message from syslogd@hostname at Feb 14 02:54:51 ...
kernel:[81927.464687] Uhhuh. NMI received for unknown reason 31 on CPU 3.

Message from syslogd@hostname at Feb 14 02:54:51 ...
kernel:[81927.464743] Do you have a strange power saving mode enabled?

Message from syslogd@hostname at Feb 14 02:54:51 ...
kernel:[81927.464791] Dazed and confused, but trying to continue

Después de recibir esto, el servidor simplemente se reinicia.

¿Leí en algunos otros sitios web que está relacionado con el hangout de la CPU? Pero no fueron recursos útiles.

usuario209395
fuente

Respuestas:

4

Esto casi siempre es un mal hardware. Ejecute memtest durante un par de horas, ya que es lo más fácil de hacer. A partir de ahí, investigue su procesador, tarjetas adicionales, placa base, etc.

cuello largo
fuente
¿Tiene alguna otra herramienta que pueda ejecutar bajo el núcleo? Dado que esta es una máquina servidor que no está cerca de mí ..
user209395
Las interrupciones malas generalmente significan "chipset southbridge defectuoso".
Avery Payne
3
Esto me acaba de pasar, todas las ventanas de mi terminal recibieron esos mensajes, pero no pasó nada malo y no ha vuelto a pasar. ¿Deberia estar preocupado?
Hubro
2

Como se mencionó anteriormente, esto parece ser un error de hardware, "NMI recibido por una razón desconocida 31 en la CPU 3". La interrupción NMI o no enmascarable es una interrupción de hardware que el procesador no puede ignorar. La interrupción NMI es generalmente para una tarea importante o para informar un error de hardware

El sistema operativo no tiene mucho papel que jugar, así que aquí puedes hacer estas cosas

  1. Instale mcelog rpm para obtener información más profunda

  2. Si se trata de un nodo HP, cambie la opción de BIOS de HP para el modo de ahorro de energía a "Control del sistema operativo" desde cualquier otro modo configurado, como "Modo de ahorro de energía dinámico" o "Estático - Alto rendimiento".

  3. Actualizar BIOS o firmware

Pero el mejor consejo es contactar al vendedor de hardware

Prashant Lakhera
fuente