Estamos ampliando nuestra configuración de Nagios 3, y con frecuencia nos encontramos con nuevos NRPE o complementos generales de Nagios para probar nuestra infraestructura existente. Sin embargo, esto está en dribs y drabs: sería útil obtener un resumen de los complementos que los usuarios de Nagios valoran más.
Enumere un solo complemento por publicación, preferiblemente con una breve descripción de por qué le encanta y un enlace al sitio de desarrollo de ExchangeExporting o plugin. De esta manera, la gente puede votar por los complementos ya enumerados y podemos verlos en orden preferencial.
Sería mejor no enumerar los complementos que otros ya han mencionado, por la misma razón. Si tiene más que agregar con respecto a un complemento que alguien más ha enumerado, deje un comentario a su respuesta.
¡Gracias!
fuente
Nuestros complementos más útiles son uno que prueba nuestra mayor funcionalidad de la aplicación. Por ejemplo, tenemos pruebas que intentan iniciar sesión en el sitio web y pruebas que intentan enviar un correo electrónico y marque una casilla de correo pop3 para asegurarse de que llegó. Si alguna de esas cosas se rompe, podemos usar controles de nivel inferior para ver qué está mal. ¿Está muerto el pop3? la MTA, la MDA? El servidor de la base de datos? el almacén de datos?
fuente
Honestamente, el que más hace por mí es viejo
check_disk
. Nada me hace sentir tan especial, en esa forma de "dejar de comer la pasta", como tener un servidor que funcionaba bien ayer explotar, correr como un loco y luego descubrirlo porque dejé que los discos se llenaran. Nunca tener que hacer eso de nuevo en mi vida vale mucho para mí.(Y no se olvide de verificar los inodes, también, los niños observan en casa).
fuente
WebInject es muy útil para monitorear sitios web si desea ir más allá de la funcionalidad check_http; puede manejar páginas de inicio de sesión y realizar múltiples pasos en una verificación de Nagios.
fuente
Creo que check_nfsmount es útil en muchos de mis servidores.
Editar: También votaría check_snmp si tuviera el representante para hacerlo. Está en uso en todos mis servidores, más la lógica detrás de check_hpjd que tengo en todas mis impresoras HP.
fuente
El más útil es el que escribí yo mismo que verifica los certificados SSL en nuestros servidores web para poder vigilar la caducidad.
fuente
PNP (pnp4nagios.org): genera gráficos de estilo RRD para cualquier verificación de Nagios que genere perf. datos. Increíblemente útil, especialmente cuando se trata de convencer a los desarrolladores de que ese servicio recién instalado realmente es la causa de todos esos picos de CPU ...
fuente
check_nt (hablar con NSClient o algo similar sobre el tema) le permite interrogar a WMI en un cuadro de Windows; si hay un contador de rendimiento para él, ahora puede monitorearlo con Nagios.
fuente
Este es un complemento un poco descarado, pero si está monitoreando máquinas Windows usando NRPE, NagiosPluginsNT parece funcionar bastante bien. ;-)
fuente
Estoy de acuerdo en que check_snmp es un complemento extremadamente valioso; se puede usar para casi cualquier propósito y, en general, todo aparece en SNMP. SNMP está disponible en sistemas tan diversos como HP-UX, Tru64 y OpenVMS sin instalaciones adicionales.
Otro complemento (no del todo un) que es muy útil es NagiosGrapher; Tengo mi experiencia en un artículo que explica más, pero también para que otros puedan usarlo sin las dificultades que experimenté.
Una última: NSCA. Puede escribir un script Perl o Ruby o ksh y alimentar la salida a NSCA.
Entre las flexibilidades de NSCA y SNMP combinadas con los informes de NagiosGrapher, esto debería expandir su monitoreo muy bien.
fuente
Me gusta check_http para verificar que mis sitios web todavía funcionan, lo he expandido para verificar que se pueda encontrar cierto texto en él después de que una vez que mi empresa de alojamiento decidiera servir páginas en blanco y mis cheques nagios pasaron cuando el servidor todavía estaba funcionando.
fuente
El más útil para mí es uno que escribí para mis necesidades: nagios-check-webpage
Descarga una página completa con js / css / images, con múltiples hilos y gzip (ahorre mucho ancho de banda), como navegadores reales.
fuente
El número uno es NagiosWSC Le permite monitorear sin agentes los hosts de Windows a través de WMI
fuente
Uno que verifica la latencia real para abrir sitios web y lo escanea en busca de una etiqueta oculta 'estado: ok'. Se detectó un problema con nuestro caché de calamar y un problema de conjunto de idiomas que solo ocurría una vez cada dos noches a las 3 am cuando alguien visitaba el sitio con un navegador que solicitaba una versión internacionalizada de la página en idioma turco.
En serio, configure todo tipo de monitoreo que pueda. Los errores y errores extraños que puede detectar en un entorno complejo con una buena supervisión son simplemente sorprendentes. Además, registre sus datos de rendimiento en una base de datos rrd y muéstrelos en Cacti.
fuente
Uno de los complementos más importantes es el que he escrito yo mismo: check_rdiff_backup. Hago copias de seguridad en el extranjero, y Nagios me dice si algo les sucede y cuándo.
Si está buscando el complemento rdiff-backup, hay uno que puede encontrar en Google.
fuente
check_curl para mí ha sido un regalo del cielo. Realmente marcó la diferencia en cuanto a flexibilidad para hacer verificaciones del sitio web, y también lo encontré mucho más fácil que webinject, con casi la misma funcionalidad que necesitaba
fuente
No es estrictamente un complemento, pero hacer que twurl ( https://github.com/marcel/twurl ) funcione como un medio para activar las alertas fue una bendición absoluta. No hay necesidad de alertas por SMS y simplemente satisface todo.
Detalles sobre cómo se hizo: alertas de Nagios usando Twitter (con twurl) sin disparar - disculpas por la descarada autopromoción;)
Otras cosas...
Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) ha sido increíblemente útil junto con la carga de CPU estándar y las comprobaciones de número de proceso para determinar cuándo / si IO está vinculado, y de qué manera . El uso de nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) lo hace aún más fácil.
fuente
Bueno, los simples, simples y predeterminados: check_disk, check_load, check_http son lo suficientemente perfectos para la mayoría de los casos (en su mayoría, queremos saber si los servidores, los sitios web están funcionando correctamente)
y además de check_disk y check_swap, hay un check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details que proporciona el uso de la memoria ...
fuente
¡Centreon definitivamente para gráficos y todas las características de Nagios!
fuente
check_multiprocs usado con el texto de enlace check_nrpe
fuente
Esto es una especie de trampa, porque he desarrollado mucho en él, y en realidad comprueba muchas cosas diferentes a la vez, pero el 'complemento' de nagios más útil para mí es Resmon . Es un agente que ejecuta en el servidor y nagios se conecta a través de http para realizar las comprobaciones. Supongo que es similar a lo que hace nrpe, pero con varias decisiones de diseño diferentes.
fuente
Había usado dos complementos ... uno era proporcionar alimentación XML de las alertas y otro para enviar alertas a través de Twitter. Ambos fueron útiles (aparte de los complementos regulares). si cuenta NRPE como un complemento, agréguelo también.
fuente
check_apt es realmente genial y me recuerda sobre la actualización de mis servidores Debian.
fuente
Recientemente comencé a usar el complemento check_multi , usando un NRPE parcheado / mejorado para una salida grande (debido a la información HTML y de rendimiento).
¡Es casi "un complemento para gobernarlos a todos"! ;-)
fuente