Para obtener una lista más completa de herramientas de monitoreo y sus características, consulte esta página de Wikipedia .
Como dice la pregunta, ¿cuáles son las herramientas más utilizadas para esta tarea y cuáles son sus fortalezas y debilidades?
monitoring
voretaq7
fuente
fuente
Respuestas:
He usado Nagios en el pasado con éxito. Es muy extensible (más de 200 complementos), relativamente fácil de usar y con muchos informes. Un negativo sería la configuración inicial.
fuente
Cacti es una interfaz web muy buena para RRDTool , que proporciona gráficos y estadísticas muy útiles. RRDTool es la parte que recopila datos de múltiples sistemas y monitorea una amplia gama de datos técnicos.
Estamos utilizando esa solución cacti / RRDTool para monitorear los sistemas Unix y Windows. Obtenemos muchas métricas útiles que incluyen carga, uso de CPU / RAM, espacio HD, usuarios conectados, tráfico de red, procesos en ejecución, etc.
Encontrará más información sobre los cactus en ¿Qué son los cactus? página.
fuente
Personalmente, me encanta Munin, que es muy fácil de instalar y para escribir complementos, ya que tiene una arquitectura muy sencilla. Ya hay bastantes complementos para todos los propósitos que pueda imaginar, por lo que probablemente ni siquiera tendrá que escribir complementos en primer lugar.
También proporciona gráficos hermosos y la opción de configurar alertas (muy básicas).
fuente
Zabbix . Es de código abierto y razonablemente simple de configurar y personalizar. Tenemos muchos scripts de monitoreo personalizados que se introducen en el servidor zabbix, pero se encarga de centralizar esos datos, mostrarlos adecuadamente, notificaciones (correo electrónico, mensajería instantánea, SMS, twitter, etc.), etc.
fuente
He estado implementando Spiceworks en nuestra empresa y estamos encontrando que es una gran herramienta no solo para monitorear servidores sino todo lo demás en la red.
Hace cosas como inventario automático y monitoreo personalizado para enviarle correos electrónicos cuando hay un problema (por ejemplo: la impresora tiene un 10% de tinta o el disco duro de este servidor tiene un 20%).
Su desventaja probablemente sea la densidad de información por computadora, no se equivoque, tiene MUCHOS datos por máquina, pero para cosas como servidores en los que puede desear muchas estadísticas, puede necesitar usar otra herramienta.
EDITAR: oh, ¿mencioné que su modelo de negocio se basa en que es gratis para siempre?
fuente
Smokeping no solo verifica la disponibilidad de varios servidores y servicios, sino que también realiza un seguimiento de su latencia al tiempo que proporciona gráficos fáciles de usar, atractivos y rápidos de mostrar .
Existe una amplia gama de complementos de medición de latencia listos para usar. Si conoce algo de Perl, es fácil crear los suyos propios para cualquier necesidad exótica.
Las grandes instalaciones se beneficiarán del Sistema Maestro / Esclavo para la medición distribuida.
El sistema de alerta altamente configurable lo ayudará a notar problemas antes de que comiencen a afectar a los usuarios o evolucionen a una interrupción importante.
Smokeping es un software gratuito y de código abierto escrito en Perl por Tobi Oetiker, el creador de MRTG y RRDtool
fuente
OpenNMS se usa donde trabajo para monitorear más de mil máquinas Linux. Monitoreamos el hardware de cada máquina y las aplicaciones que se ejecutan en ellas.
fuente
Zenoss Core es de alguna utilidad, lo estamos utilizando (durante aproximadamente un año) para el monitoreo ligero de servidores, conmutadores de red y UPS.
fuente
Nagios es genial ya que es gratis y hay muchos complementos para ello. Sin embargo, la interfaz de usuario y la configuración son muy difíciles.
Es exactamente lo contrario en pro's / con's, que también es genial: Microsoft System Center Operations Manager (SCOM), que no es gratuito, tiene menos complementos, pero la configuración y la configuración son brillantes y fáciles.
Debo admitir que si estaba en una empresa principalmente de Microsoft, tenía requisitos de dependencia muy altos (es decir, no podía permitir que la supervisión se interrumpiera) o tenía que pensar en hacer que los desarrolladores trabajen con ella, entonces SCOM sería mi recomendación sobre Nagios.
fuente
He usado:
fuente
Usamos AlertFox desde hace unas semanas y estamos muy contentos. No solo verifica nuestro tiempo de actividad y rendimiento, sino que también monitorea el carrito de compras, el inicio de sesión del usuario y otras partes críticas del sitio web a través de scripts de transacción (basados en iMacros).
Para nuestro monitoreo interno (espacio en disco, etc.) usamos Nagios .
fuente
PRTG Network Monitor: no puedo decir suficientes cosas buenas al respecto. Impresionante front-end web y especialmente excelente para monitorear enrutadores (ancho de banda, etc.) y otros dispositivos a través de SNMP y medir el tiempo de actividad de SLA, etc.
www.paessler.com
fuente
Como persona de Windows, MOM. Estamos buscando actualizar a Systems Center Operations Manager (SCOM), pero no será necesario hasta que comencemos a implementar Windows 2008.
fuente
Soy parte de un proyecto de actualización de monitoreo operativo. Hemos tenido varios proveedores en el sitio para presentar algunos sistemas de gran dólar y mezclar algunas alternativas más baratas para comparar.
Uno de ellos es Hyperic , que también está disponible como una solución gratuita de código abierto. Me impresionaron sus capacidades y extensibilidad para agentes personalizados.
fuente
Para monitorear estadísticas (uso de memoria, carga, actividad de mysql, actividad de apache, etc.) utilizo Munin . Fuera de la caja, ya rastrea muchas cosas y traza gráficos para diferentes intervalos de tiempo (últimas 24 horas, últimos 7 días, último mes, año pasado). A través de complementos, se pueden monitorear aún más cosas. Su salida son páginas HTML con bonitos gráficos.
Munin tiene una arquitectura maestro / nodo: los nodos recopilan estadísticas en un servidor y el maestro almacena los datos y produce HTML y gráficos.
Utilizo Monit para realizar un seguimiento de los procesos en ejecución y para reiniciarme o alertarme cuando surgen ciertas condiciones configurables (carga de CPU alta, uso de memoria elevado, sin respuesta HTTP, etc.) Monit también puede monitorear cosas más generales sobre un servidor, como CPU carga, uso de memoria, estado del disco duro o uso del disco.
Monit debe configurarse para cada servicio o hardware que desea monitorear y cómo responder cuando algo sale mal. Las opciones más utilizadas son no hacer nada, enviar un correo electrónico de alerta o reiniciar el servicio.
Monit es excelente cuando funciona, pero a veces no puede iniciar, detener o reiniciar un servicio y no hay mucha información de diagnóstico disponible para decirle qué salió mal. Esto significa que no sabe si el problema fue con su servicio o con la configuración de Monit, que se ejecuta con un entorno mínimo similar a cron.
Ambas herramientas están disponibles por defecto en la mayoría de las distribuciones de Linux.
fuente
Me sorprende que nadie haya mencionado logwatch o logcheck para servidores linux, ¡ahorra una tonelada de tiempo leyendo registros!
fuente
Yo uso Pingdom para monitorear mi servidor. Me envía un mensaje SMS cuando el servidor no está disponible.
fuente
Nuestro proyecto utiliza Ganglia para nuestros más de 100 grupos de nodos. Una razón por la que lo usamos es porque es la herramienta de monitoreo que viene con Rocks .
Es importante para nosotros tener una sobrecarga muy baja en cada nodo para que haya tantos recursos como sea posible disponibles para el cálculo. Ganglia nos brinda una buena visión general del clúster y nos permite profundizar en nodos individuales si es necesario. Además de saber lo que está sucediendo en este momento, podemos ver bastante bien lo que sucedió durante la última hora, día, semana, mes y año. Los gráficos de varias estadísticas son básicos y funcionales.
fuente
¡Todo depende de lo que quieras decir con "monitor"!
fuente
Graphite ( http://graphite.wikidot.com/ ) es un nuevo participante en la escena que debe competir con Cacti y las soluciones basadas en RRDTool .
RRDTool se reemplaza con una tienda de respaldo llamada Whisper. Los documentos brindan una visión general bastante buena de por qué difiere y realmente me gusta la CLI para gráficos ad hoc al investigar algo.
fuente
Usamos (y nos gusta) WhatsUp de Ipswitch para nuestra red de Windows relativamente pequeña. Es fácil de configurar y relativamente fácil de administrar, y sabe cómo lidiar con los servidores de Windows, así como con las cosas estándar.
Para redes más grandes, redes no orientadas a Windows o redes con muchas cosas variadas, recomiendo sinceramente OpenNMS . El software OpenNMS es gratuito y la empresa está más que feliz de vender servicios de soporte e implementación. ¡También es dirigido por un amigo mío muy afilado de la universidad!
fuente
Para aquellos a quienes no les gusta la interfaz web de Nagios, existe NPC , un complemento para Cacti que hace que la interfaz de usuario de Nagios esté disponible desde Cacti, pero con una mejor apariencia (ajax, etc.).
Se lee de una base de datos proporcionada por NDO2DB , que es una excelente manera de tener su infraestructura disponible desde una base de datos para usar en scripts y otras herramientas.
fuente
Actualmente utilizamos PRTG de Paessler . Es excelente. No se requieren agentes, excelente interfaz web de Ajax, registro histórico, gráficos, WMI, etc. Hay una versión de 10 sensores disponible de forma gratuita, pero obtuvimos un par de grandes para la versión empresarial. Dinero bien gastado.
fuente
Hobbit: es una versión mejor y más rápida de Big Brother (que parece ser alarmantemente comercial en estos días).
http://hobbitmon.sourceforge.net/
fuente
Si tiene prisa y desea una herramienta rápida para monitorear su servidor MS, use el monitor de rendimiento para Windows, configure un registro de contador con una plantilla de monitoreo personalizada y un programa personalizado (por ejemplo: recopile datos durante 5 minutos cada hora). Luego descargue la herramienta LogParser de Microsoft y la herramienta de análisis de rendimiento de registros (PAL) de Codeplex ( http://pal.codeplex.com/ ) para procesar el registro de su contador. PAL generará un excelente informe documentado con enlaces a posibles documentos / herramientas para resolver problemas.
fuente
Utilizo una combinación de Solarwinds, pestañas de rendimiento del servidor VMware y scripts personalizados.
Solarwinds Orion Network Performance Monitor es lo que uso con nuestro sistema Windows. administradores en mis servidores web. Todavía obtengo algunas métricas de aplicaciones útiles ejecutándose en él, pero tiene buena información sobre cosas básicas de nivel de caja (disco, red, CPU).
Para mis invitados VMware, me encantan las pestañas de rendimiento.
Para mis servidores Sun, cuando necesito algo que no está disponible en Solarwinds (porque nuestro administrador no lo ha agregado o qué), escribo scripts personalizados (generalmente en Perl) para monitorear cosas como el estado del espejo, el uso de intercambio, etc.
Me gustaría obtener más información sobre Solarwinds, pero solo hay como 26 horas en un día (o eso cree mi jefe), así que creo que eso puede ser un poco limitante ...
fuente
Usamos OpsView , que se ejecuta sobre Nagios. La webUI nos ayuda a implementar nuevas definiciones de monitor de host sin tener que permitir el acceso SSH, proporciona vistas públicas y registra valores históricos. Esto es útil para aprovisionar y determinar líneas de base adecuadas.
fuente
Zabbix ( http://www.zabbix.com ) también es bueno y más fácil de configurar que Nagios.
fuente
Lamento decirlo, pero terminé usando muchos scripts personalizados. Aunque lejos de ser ideal, dudo que haya una solución más común.
fuente
Hemos escrito nuestro propio software de monitoreo. Nuestro código no es tan sofisticado como un paquete comercial, pero no necesitábamos mucha funcionalidad. Era más fácil escribir el nuestro que investigar otros paquetes y aprender a usarlos. El código hace exactamente lo que queremos y es fácil de extender.
fuente