¿Cuál es la estrategia para detectar la deriva del tiempo en un centro de datos basado en Linux?

14

¿Cuál es la estrategia para detectar la deriva del tiempo en todos los centros de datos basados ​​en Linux? Este es un problema más difícil de lo que parece al principio.

La deriva del tiempo puede causar serios problemas para ciertas aplicaciones y, a menudo, aunque NTP esté instalado, es posible que falle por los siguientes (y muchos más) motivos:

  • NTP no se configuró correctamente para reiniciarse automáticamente al reiniciar.
  • La configuración de un servidor es incorrecta, por lo que el servidor de hora al que apunta no está disponible o es incorrecto.
  • El servidor de hora maestro no es accesible y todos los servidores que se están sincronizando con él ahora se están sincronizando con una fuente no confiable.

Me gustaría una forma de detectar si todos los servidores individuales son correctos. Tenga en cuenta que el servidor con el script / aplicación de prueba puede no ser correcto.

Stuart Woodward
fuente
66
Creo que sus razones son falsas, el NTP operativo es crítico para la granja. Asegúrese de que NTP funciona correctamente. Además, implemente un reloj maestro local.
user539484
NTP funciona de inmediato en muchas distribuciones de Linux con valores predeterminados razonables. Es prácticamente un problema ahora.
Matt

Respuestas:

20

Esto es fácil de controlar. La gestión de la configuración es la clave ...

Asegúrese de que el servicio ntp se esté ejecutando y configurado ...

Por ejemplo, usar Monit para asegurarse de que se ntpdestá ejecutando y reiniciarlo si falla es un enfoque fácil ... Puede tener sentido agregar cron y otros demonios esenciales a ese tipo de verificación.

Otra opción es usar una herramienta de administración de configuración como Puppet para forzar el mismo ntpd.conf a sus servidores y asegurarse de que ntpd esté instalado, configurado y ejecutándose.

Hay suficientes redundancias en el protocolo NTP para tratar con la instancia de un servidor de tiempo que no se puede alcanzar. Especificar múltiples fuentes.

ewwhite
fuente
3
Tengo que hacerme eco de este sentimiento. La gestión de la configuración y los múltiples servidores NTP son piezas básicas de la infraestructura en todo lo que se aproxime a un "centro de datos". Un centro de datos mediano o grande debe tener un reloj de hardware. Las fuentes de tiempo de GPS se pueden comprar por unos pocos cientos, y si tiene un soldador <$ 100.
Chris S
esta solución + nagios
ese tipo de allá
44
Tenga en cuenta que la forma en que verifica ntpdel estado es muy importante. No solo quieres decir "ntpd se está ejecutando. ¡Todo está genial!". En realidad, debe verificar que su sistema se esté sincronizando y tenga un par funcional, o que el desplazamiento de tiempo sea mínimo entre el host y la caja de monitoreo . Nagios tiene check_ntp_peery check_ntp_timequé maneja eso, si quieres usar Nagios.
voretaq7
ntpq para verificar el estado
kubanczyk
10

Hay una variedad de complementos check_ntp para nagios por ahí.

Aquí hay uno:

http://nagiosplugins.org/man/check_ntp

Agregue esta verificación a su host nagios y reciba alertas si algo sale mal.

dmourati
fuente
Sí, simplemente configure su sistema de monitoreo para verificar que el tiempo sea válido, o al menos el desplazamiento relativo al sistema de monitoreo es mínimo.
Zoredache