ProCurve CPU al 100% durante varios minutos después del reinicio

9

He estado haciendo actualizaciones de firmware en los conmutadores HP. Se han actualizado dos modelos diferentes:

  • ProCurve Switch 5406zl Intelligent Edge (J8697A): actualizado de K.15.06.0008 a K.15.12.0012
  • Conmutador HP 2520-24G-PoE (J9299A): actualizado de J.14.54 a J.15.09.0021

Comprobando cada interruptor justo después de iniciar la nueva imagen, he observado algo:

  1. Los conmutadores cargaron la nueva imagen de firmware sin errores y la conectividad se recuperó tan pronto como se inició el conmutador. En este punto, el uso de CPU era bajo (menos del 10%)
  2. Pocos segundos después, el uso de la CPU aumentó hasta el 100% y permaneció allí durante varios minutos. No pude detectar ningún problema en este punto, aparte de que la CLI a través de SSH es un poco lenta: conectividad normal, sin mensajes de registro ...
  3. Después de cinco a diez minutos al 100%, la CPU volvió a la normalidad sin ningún cambio de mi parte.

Ambos modelos estaban teniendo este comportamiento. Retrocedí una unidad de cada modelo a la imagen de firmware anterior y se comportaron de la misma manera.

A pesar de que este pico de CPU justo después del arranque no causó ningún problema, me pregunto si el comportamiento normal de la red podría ser la causa de este pico, pero no lo creo. He considerado los siguientes aspectos:

  1. Justo después del inicio, STP comienza a ejecutarse, genera BPDU y cicla todos los puertos en el conmutador a través de los estados Bloqueo, Escucha, Aprendizaje y Reenvío. Sin embargo, incluso con 802.1D, este proceso no lleva más de 1 minuto con temporizadores predeterminados. Además, estaba comprobando los conmutadores a través de SSH, por lo que todos los cálculos de STP ya estaban hechos cuando pude conectarme al conmutador.

  2. Justo después del arranque, la tabla de direcciones MAC está vacía y se necesita difusión para que se reenvíen los primeros cuadros. Pero dudo que esta transmisión tome 100% de CPU, mucho menos durante 5 minutos, en un conmutador de 24 puertos.

  3. Todos los conmutadores actúan como dispositivos L2, no se habilita la funcionalidad L3, por lo que descarto el enrutamiento y otros procesos L3.

¿Me estoy perdiendo algo "normal" en las operaciones de red que puede explicar este uso de la CPU durante 5 minutos después del reinicio mientras se mantiene la conectividad? ¿Tal vez es algún tipo de proceso en segundo plano que el conmutador se ejecuta justo después de reiniciar?

Daniel Yuste Aroca
fuente

Respuestas:

8

Esto tomó menos de 2 segundos en Google: portal de redes HP

Serie de conmutadores HP ProCurve 5400zl: alta utilización de la CPU (99-100%) después del problema de inicio

Inmediatamente después de que se inicia el interruptor, se observa una alta utilización de CPU (99-100%). Solución

Cuando se inicia el conmutador, una de las tareas de inicialización es la creación de claves de cifrado. Tener las claves creadas de antemano significa que más tarde, cuando se configura o utiliza una característica como SSL o SSH que utiliza las claves, hay un retraso mínimo en la disponibilidad. Esta tarea demora unos segundos antes de que se acelere, según el modelo del interruptor, la configuración que se está cargando y la revisión del software. Aunque la tarea consume hasta el 100% de la CPU, se ejecuta con una prioridad muy baja. Por lo tanto, si se inicia otra tarea que requiere ciclos de CPU, esta tarea de baja prioridad se anulará. Si esta tarea de inicialización / generación de claves se ejecuta sin interrupciones por tareas de mayor prioridad, se tarda unos 10 minutos en completarse. Si la CPU está ocupada con otras tareas, el tiempo de finalización se extenderá.

Para verificar que la CPU elevada que se está viendo es, de hecho, lo que se ha descrito aquí y no otra cosa que requiere solución de problemas, utilice los comandos que se documentan a continuación.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

La salida tendrá el siguiente aspecto.

Switch # task-monitor cpu Switch # show uptime 0000: 00: 01: 42.36 Switch # show cpu

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services
Ron Trunk
fuente
Estoy de acuerdo en que esto parece describir el problema que he experimentado. Pero entonces una nueva pregunta viene a mi mente. Como dije, estaba chequeando los interruptores a través de la conexión SSH. Si las claves SSH se generan unos segundos después de iniciar sesión: ¿cómo podría iniciar la sesión SSH antes de que las claves estuvieran listas?
Daniel Yuste Aroca
2
De la Guía de seguridad de acceso de Procurve: cuando genera un par de claves de host en el conmutador, el conmutador coloca el par de claves en la memoria flash (y no en el archivo de configuración en ejecución). Además, el conmutador mantiene el par de claves en los reinicios, incluidos los ciclos de encendido. Al eliminar (poner a cero) el par de claves pública / privada del conmutador, el conmutador no puede participar en la operación SSH y automáticamente deshabilita IP SSH en el conmutador.
Daniel Yuste Aroca