Promedio de carga aceptable

9

Implementamos nuestro nuevo servidor de correo Linux / Exim / Spamassassin el viernes (siempre es una buena idea implementar el día antes de un fin de semana largo cuando no hay administradores). La carga ha estado rondando alrededor de 1.3 en el promedio de 15 minutos.

La máquina responde y los correos se entregan en un tiempo razonable. ¿Podemos suponer que esto es aceptable?

¿Cómo se considera aceptable o no aceptable una cierta cantidad de carga? ¿Qué métricas se usan?

Zimmy-DUB-Zongy-Zong-DUBBY
fuente
3
¿Cuántas CPU, cuánta RAM? ¿está ejecutando x / GDM?
Tim Howland
¿Cuánto correo manejas a diario?
baumgart

Respuestas:

11

Regla básica: si el sistema responde, si funciona de manera oportuna, entonces está bien.

Las cargas por debajo de dos no son una gran preocupación. He tenido cuatro o cinco sistemas y todavía funciona bien, aunque eso sería un indicador de que hay muchos problemas de colas con la red o las unidades (los problemas de E / S pueden causar grandes cargas a pesar de que el sistema es muy sensible).

Verifique periódicamente las longitudes de las colas de correo y los registros en busca de problemas no entregados y problemas de esa naturaleza. Si la cola de entrega se mantiene relativamente baja, está bien.

Puede obtener muchos promedios de disco e información de E / S de red, pero si no ve problemas de entrega (¡envié el mensaje hace quince minutos y aún no ha llegado!) Y puede trabajar en el sistema a través de la consola ( o ssh) sin mucha latencia, deberías estar bien.

Bart Silverstrim
fuente
18

El promedio de carga es un valor que da una idea de la cantidad de procesador que necesita el núcleo para poder ejecutar todas las tareas cuando lo necesitan sin esperar.
En su caso, si tiene 2 o más CPU / Core. No hay ningún problema. Si solo tiene 1 CPU con 1 núcleo, significa que hay "demasiado" tiempo entre el momento en que su aplicación desea ejecutarse y el momento en que el núcleo la ejecuta. Una carga> "número de CPU / núcleo" no será un problema para un sistema de correo hasta que alcance un valor demasiado alto durante demasiado tiempo.
Por supuesto, no es una regla y un valor para dar, y aunque reciba su correo en poco tiempo, está bien. Pero probablemente deba comenzar a mirar de cerca a su servidor cuando la carga es mayor que 2 * número de CPU / núcleo con demasiada frecuencia durante un período 'largo' (~ 1 hora).
Nuevamente para un servidor de correo, esto no será un gran problema, pero comenzará a significar que su servidor está un poco sobrecargado.

radio
fuente
¡+1 cosas geniales e interesantes!
Marco Demaio
3
Agrego un enlace a una página web bastante buena blog.scoutapp.com/articles/2009/07/31/…
radio del
3

Como siempre con las preguntas relacionadas con el ajuste, no hay respuestas de sí / no, todo depende :-)

Dicho esto, una carga de 1.3 no suena alta, especialmente si tiene una configuración de CPU de múltiples núcleos. Si el número de carga es el mismo que el número de núcleos, entonces todos los núcleos siempre tienen un proceso listo para ejecutarse.

En última instancia, si, como usted dice, los mensajes se entregan de manera oportuna, entonces el rendimiento está bien :-)

top

le dará métricas básicas en tiempo real lo suficientemente cerca.

dr-jan
fuente
3
htop es aún mejor y más fácil de leer
Antoine Benkemoun
3

Un promedio de carga menor que la cantidad de CPU que tiene significa que hay CPU sentadas sin nada que hacer. Igual significa que todos están trabajando en este momento. Mayor significa que hay procesos que podrían estar ejecutándose, pero que están atascados en la línea de espera.

Para cosas muy sensibles al tiempo, como un servidor VoIP o Memcache, desea que su promedio de carga esté muy por debajo del número de núcleos. Para cosas asíncronas que pueden vivir con la copia de seguridad ocasional (como el correo electrónico), puede ejecutar fácilmente 4 veces la cantidad de núcleos.

La mayor advertencia para recordar es que los procesos que están esperando la entrada y salida del disco o la red, pero que de otra manera son ejecutables, todavía aparecen en el promedio de carga. Entonces, si tiene un servidor apache que alimenta jpg's a 56k usuarios, puede ejecutar un promedio de carga mucho mayor que si dispara respuestas php / whatever-script a un proxy / loadbalancer a través de una LAN gigabit. En su caso, una conexión smtp a un servidor de correo lento que tarda una eternidad en transferir un archivo adjunto mostrará un proceso 1 en la cola de ejecución, pero podría interrumpirse veinte veces para enviar un correo electrónico rápido de una línea a gmail sin problemas.

Empuje viene a empujar, el promedio de carga es como el DOW. En realidad no mide de ninguna manera la "economía", la gente simplemente la usa como una métrica muy poco correlacionada porque es fácil hablar de ella. Concéntrese en monitorear las métricas que realmente le interesan, como la profundidad de la cola de entrega y los mensajes por segundo.

cagenut
fuente
2

¿Cuántos núcleos tienes? cat / proc / cpuinfo | procesador grep | wc -l

(advertencia: hyperthreading parece más núcleos, pero no lo es)

Si su nivel de carga está por debajo del recuento de su procesador, generalmente está bien.

También eche un vistazo a la parte superior y presione '1' y podrá ver la carga individual de cada CPU.

Joel K
fuente
1

Sí, eso es bastante aceptable, y generalmente es algo que se espera con un filtro de correo.

Nuestra configuración es un poco diferente. Tenemos un servidor separado para SpamAssassin, mientras que nuestro servidor POP ejecuta ClamAV para buscar virus. El servidor POP generalmente se ejecuta con una carga de servidor de 2, pero ocasionalmente aumenta hasta 10 o más. Nuestro servidor SpamAssassin, por otro lado, solía funcionar alrededor de 2 hasta que también instalamos los filtros Openprotect.com, cuando duplicó el uso de la CPU y ahora se ejecuta en menos de 5 con picos por encima de 15. Esto todavía es aceptable porque no lo hacemos tiene retrasos en el correo que resultan en una cola de correo creciente (usamos qmail para SMTP entrante), y todavía hay espacio para ahorrar uso de CPU / memoria.

Casualmente, recomiendo Munin para monitorear sus servidores. Hace un gran trabajo al demostrar visualmente datos históricos y mostrarle qué recursos tiene de sobra. Monitorear en tiempo real con Top (1) no te ayuda mucho. :)

Ah, y por cierto, desplegar el viernes antes del fin de semana largo es una excelente manera de trabajar durante todo el fin de semana. Especialmente para sistemas críticos como un servidor de correo.

Ernie
fuente
vea también collectd, como se menciona aquí: serverfault.com/questions/67234/…
warren
0

¿Cómo va el consumo de memoria? ¿Es estable o está creciendo?

La carga no parece estar fuera de la norma. Si el servidor de correo responde, y el correo está funcionando, diría que la única medida de falla más allá del consumo de memoria sería si los correos electrónicos incorrectos están llegando (spam).

Eso sí, hoy sería tu primera prueba real. Probablemente lo controlaría a la ligera hoy. Si algo va a salir mal, ahora sería el momento.

Highstead
fuente