La caja de Centos se bloquea con un error irq

1

Cada dos meses, la red se bloquea y la máquina debe reiniciarse manualmente.

Por lo general, solo actualizo el kernel y espero lo mejor. Pero esto parece persistir, aunque solo unas pocas veces al año. ¿Hay algún argumento que deba pasar al kernel?

Ejecutando Centos 6.9. Gracias por adelantado...

Jun  1 07:51:26 search6 kernel: irq 63: nobody cared (try booting with the "irqpoll" option)
Jun  1 07:51:26 search6 kernel: Pid: 0, comm: swapper Tainted: G        W  -- ------------    2.6.32-642.13.1.el6.x86_64 #1
Jun  1 07:51:26 search6 kernel: Call Trace:
Jun  1 07:51:26 search6 kernel: <IRQ>  [<ffffffff810f583b>] ? __report_bad_irq+0x2b/0xa0
Jun  1 07:51:26 search6 kernel: [<ffffffff810f5a3c>] ? note_interrupt+0x18c/0x1d0
Jun  1 07:51:26 search6 kernel: [<ffffffff81014b19>] ? read_tsc+0x9/0x10
Jun  1 07:51:26 search6 kernel: [<ffffffff810f6085>] ? handle_edge_irq+0xf5/0x180
Jun  1 07:51:26 search6 kernel: [<ffffffff8100fd29>] ? handle_irq+0x49/0xa0
Jun  1 07:51:26 search6 kernel: [<ffffffff81552cac>] ? do_IRQ+0x6c/0xf0
Jun  1 07:51:26 search6 kernel: [<ffffffff8100ba53>] ? ret_from_intr+0x0/0x11
Jun  1 07:51:26 search6 kernel: <EOI>  [<ffffffff81441b42>] ? poll_idle+0x42/0x90
Jun  1 07:51:26 search6 kernel: [<ffffffff81441b1d>] ? poll_idle+0x1d/0x90
Jun  1 07:51:26 search6 kernel: [<ffffffff81441d0a>] ? cpuidle_idle_call+0x7a/0xe0
Jun  1 07:51:26 search6 kernel: [<ffffffff81009fe6>] ? cpu_idle+0xb6/0x110
Jun  1 07:51:26 search6 kernel: [<ffffffff8152f22a>] ? rest_init+0x7a/0x80
Jun  1 07:51:26 search6 kernel: [<ffffffff81c3b127>] ? start_kernel+0x429/0x436
Jun  1 07:51:26 search6 kernel: [<ffffffff81c3a33a>] ? x86_64_start_reservations+0x125/0x129
Jun  1 07:51:26 search6 kernel: [<ffffffff81c3a453>] ? x86_64_start_kernel+0x115/0x124
Jun  1 07:51:26 search6 kernel: handlers:
Jun  1 07:51:26 search6 kernel: [<ffffffffa0193ef0>] (e1000_msix_other+0x0/0x130 [e1000e])
Jun  1 07:51:26 search6 kernel: Disabling IRQ #63
Dan
fuente

Respuestas:

1

El problema se origina en su tarjeta de red (e1000_msix_other). No mencionas nada sobre cómo se usa el servidor.

De todos modos, podría ser que algo en el tráfico de su red desencadene un error en el módulo adaptador / controlador de red, lo que luego causa este problema.

Esto podría ser un nuevo error, y sería útil informarlo a [email protected], que es la lista de correo del controlador.

Si solo quiere deshacerse de la condición de error, intente reemplazar su adaptador de red.

Tero Kilkanen
fuente