"Mce: [Error de hardware]: eventos de verificación de la máquina registrados" aparece en syslog. ¿Qué tengo que hacer?

19

He instalado la última versión de OSSEC (2.8.1) y también he habilitado las notificaciones por correo electrónico. Y recibo un montón de este tipo de notificaciones que dicen que hay un Error de hardware y algo sobre mce:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

Entonces, ¿qué significa esto exactamente? ¿Qué significa mce? ¿Y es este aparente error de hardware algo de lo que debería preocuparme?


Información del sistema operativo:

Description:    Ubuntu 14.10
Release:    14.10
Eric Carvalho
fuente
Tendrá que leer un poco sobre ossec, consulte las reglas: ossec-docs.readthedocs.org/en/latest/manual/rules-decoders . La interfaz web ayuda, ya que tiene varias explicaciones: ossec.net/wiki/index.php/OSSECWUI:Install
Panther
ossec es probablemente mal soportado o fuera de tema aquí ya que no está en los repositorios de ubuntu
Panther
1
Esto no se trata de OSSEC en absoluto. Recibió esa notificación porque OSSEC encontró la palabra "error" en syslog. Aunque no creo que esté fuera de tema, probablemente obtendrá más ayuda de Unix & Linux o Server Fault .
Eric Carvalho
44
@ bodhi.zazen Todo lo que tiene que hacer para estar en el tema se ejecuta en Ubuntu. Ahora eso no significa que obtendrá una respuesta, por supuesto.
Seth

Respuestas:

23

Excepción de verificación de máquina :

Una excepción de verificación de máquina (MCE) es un tipo de error de hardware de la computadora que ocurre cuando la unidad central de procesamiento de una computadora detecta un problema de hardware.

Su computadora experimentó un error de hardware y el núcleo registró un evento en un búfer. Puede usar mcelogpara registrar y ver los eventos de verificación de la máquina. Desde la página de mcelogmanual :

Las CPU X86 informan de errores detectados por la CPU como eventos de verificación de máquina (MCE). Estos pueden ser corrupción de datos detectada en los cachés de la CPU, en la memoria principal por un controlador de memoria integrado, errores de transferencia de datos en el bus frontal o interconexión de la CPU u otros errores internos. Las posibles causas pueden ser radiación cósmica, fuentes de alimentación inestables, problemas de enfriamiento, hardware roto, sistemas en ejecución fuera de especificación o mala suerte.

La CPU puede corregir la mayoría de los errores mediante mecanismos internos de corrección de errores. Los errores no corregidos provocan excepciones de verificación de la máquina que pueden matar los procesos o asustar a la máquina. Una pequeña cantidad de errores corregidos generalmente no es motivo de preocupación, pero una gran cantidad puede indicar fallas futuras.

Cuando ocurre un error corregido o recuperado, el núcleo x86 escribe un registro que describe el MCE en un búfer de anillo interno disponible a través del dispositivo / dev / mcelog. mcelog recupera errores de / dev / mcelog, los decodifica en un formato legible por humanos y los imprime en la salida estándar u opcionalmente en el registro del sistema.

Si no notó ningún bloqueo, probablemente el error se corrigió correctamente. Aún así, le aconsejo que instale mcelogpara realizar un seguimiento de tales eventos:

sudo apt-get install mcelog

Los eventos se registrarán en /var/log/mcelog. También puedes ejecutar:

sudo mcelog --client

para consultar el mcelogdemonio en busca de errores.

Eric Carvalho
fuente
2
Me pregunto por qué los errores MCE no se escriben directamente en un registro del sistema ... probablemente alguna buena razón, tal vez
Xen2050
2
@ Xen2050 Porque la decodificación del mensaje depende de la arquitectura y no siempre está documentada por los fabricantes de hardware. El error podría ser generado incluso por el bus PCIe.
Mircea Vutcovici
44
@ Xen2050: en mi máquina Fedora 25, los mensajes MCE se escriben en el diario, puedo verlos con ellos journalctl -b.
Martin Ueding