Tareas diarias / semanales / mensuales / anuales de administrador de sistemas

8

Esto probablemente debería ser wiki comunitario. Estoy tratando de llegar a una lista de todas las tareas de administrador de sistemas que deberíamos hacer regularmente porque creo que no estamos haciendo lo suficiente en nuestra empresa. La actitud aquí es que solucionar los problemas es inconveniente, pero no tenemos tiempo para realizar un mantenimiento preventivo o una mejora continua.

Diario:

  • intercambiar cinta / unidad de copia de seguridad nocturna
  • compruebe que las actualizaciones de antivirus se enviaron a todos los sistemas

Semanal:

  • intercambiar cinta / unidad de respaldo semanal
  • limpiar archivos temporales de todos los sistemas
  • desfragmentar todos los sistemas

Mensual:

  • planificar mejoras de infraestructura
  • entregar / enviar equipos obsoletos al reciclador electrónico
  • reconstruir o reemplazar estaciones de trabajo viejas
  • prueba de restauración desde copia de seguridad

Anual:

  • reconstruir o reemplazar servidores antiguos
  • reemplazar las baterías del UPS
Scott
fuente
Tienes razón, debería ser wiki comunitario. Además, no tenga demasiada prisa para segregar tareas como esa. p. ej., la planificación, la reconstrucción de máquinas, etc. deben realizarse según sea necesario, no asignarse como una tarea semanal (o cualquier otro período específico).
John Gardeniers

Respuestas:

7

Si no tiene tiempo suficiente para realizar el mantenimiento preventivo y dedica la mayor parte de su tiempo a resolver problemas, debe revisar toda su metodología. En lugar de decirte lo que debes hacer cada período, te daré algunas ideas para que no tengas que hacer cosas.

En primer lugar, necesita un buen sistema de monitoreo y la mayor automatización posible. Estos dos elementos deberían liberar más tiempo del que muchos administradores se dan cuenta hasta que lo hayan configurado bien.

Algunas de las cosas que su sistema de monitoreo debería hacer por usted son:

  • Avisarle cuando las colas de filtros de correo o spam crecen demasiado o de repente.
  • Avisarle cuando el espacio en el disco sea demasiado bajo, el uso de la CPU sea demasiado alto, etc.
  • Registre cosas como la utilización del disco para que pueda ver las tendencias a lo largo del tiempo.
  • Lo mismo con los buzones.
  • Avisarle cuando el cortafuegos registre un número anormal de visitas.
  • Lo mismo para todo lo que sirve al mundo exterior. por ejemplo, DNS y servidores web.
  • Avisarle si las actualizaciones AV son demasiado antiguas o si alguna máquina tiene el software AV apagado o desinstalado.

La desfragmentación ni siquiera debería estar en su lista de tareas porque debería ser un proceso automatizado. En el intervalo deseado, haga que el servidor ejecute comprobaciones de disco y una desfragmentación después de un reinicio. Considere vincular esto con un sistema para instalar actualizaciones y parches en cola (que se han probado previamente en una máquina que no es de producción).

Las carpetas temporales también se pueden limpiar con automatización. Creo una aplicación simple que se activa después de un reinicio que espera 10 minutos y luego limpia todas las ubicaciones temporales. La demora es garantizar que no elimine los archivos que pueden ser necesarios para una instalación o actualización que se completa después del reinicio (¡lo aprendí de la manera difícil!).

Una cosa que debe hacer manualmente en cualquier período de tiempo que le convenga es monitorear el sistema de monitoreo y la automatización, solo para estar seguro. Reviso el mío diariamente, pero en realidad no he encontrado un problema durante más de un año.

Cuando inicie su sistema y automatización, asegúrese de tener también un sistema de control de versiones para instalarlo. Puede ser realmente molesto descubrir que el último pequeño truco rompió algo más, pero no puede recordar exactamente qué cambió.

John Gardeniers
fuente
¿Qué sistema de monitoreo único puede hacer todo eso? Si existe, lo quiero!
Cypher
@Cypher, estás pensando de manera muy limitada. Un sistema de monitoreo único normalmente incluirá múltiples componentes, como Nagios y MRTG, al igual que un sistema operativo es más de un componente.
John Gardeniers
Supongo que realmente esperaba haber perdido alguna herramienta increíble que pudiera reemplazar la docena de herramientas que uso actualmente para todas esas cosas. :) +1 para herramientas de automatización y monitoreo automatizado: si tengo que hacer algo más de una vez, se automatiza.
Cypher
@Cypher, ese peaje increíble que estás buscando no es más que la computadora misma. Haga que funcione para usted, en lugar de que trabaje para ello. ;)
John Gardeniers
1

En Daily, tendría Check Event Logs, ya sea manualmente o mediante un script de algún tipo.

Tal vez mensual podría incluir actualizaciones del sistema operativo?

También diría que anualmente eche un vistazo a dónde está el mantenimiento / garantía en sus servidores.

Christopher
fuente
1

Mensual:

  • revise el uso de la infraestructura: podría decirse que esto se agrupa con el bit 'plan de mejoras en la infraestructura', pero no puede hacer planes a menos que sepa (es decir, 'tenga datos duros') qué bits necesitan mejoras.

Trimestral:

  • Prueba de conmutación por error de infraestructura: desde la capa de la aplicación (servidor web, correo electrónico) a la capa de red (conmutador, enlace de red) a la capa física (alimentación), si tiene redundancia en el sistema que espera poder salvarlo, necesita ser mantenido y probado periódicamente.
pjz
fuente
1

Aquí hay algunas copias de seguridad mensuales que quizás no haya pensado:

1) Incluso si está automatizado, sigo copiando la configuración de mi conmutador de red central en una máquina local
2) configuraciones de firewall
3) configuraciones SAN
4) configuraciones ISA exportadas (win 2003)
5) Reservas estáticas DHCP (ganar 2008)
6) Entradas DNS (ganar 2008)
7) Claves de cifrado (almacenadas en archivos binarios) a KeePass, especialmente porque nuestras copias de seguridad están encriptadas, además se guardan fuera de nuestros sistemas de copia de seguridad
8) nuestra carpeta de documentación de TI, adicionalmente guardada fuera de nuestros sistemas de respaldo
jftuga
fuente
0

En Daily, podría recomendar que agregue la suscripción a las conocidas listas de correo de vulnerabilidad de parches y que tenga un proceso de parches / actualizaciones.

Esto solo puede suceder una vez al mes, pero solo se necesita un mensaje perdido sobre la vulnerabilidad de un producto para causar mucha interrupción.

Creo que esto podría resumirse en un par de palabras para que quepan en una línea, si está de acuerdo.

Por cierto; Esta es una gran lista, espero ver su finalización.

Nick O'Neil
fuente
0

Auditorías internas:

  • Compare los sistemas que se lanzaron con la lista de sistemas de los que se realiza una copia de seguridad. ¿Se infiltró algo en la producción sin respaldo? (al menos una vez al mes, si no con mayor frecuencia, según cuánto se implemente)
  • Visite sus cintas si tiene una bóveda externa. Asegúrese de que estén donde se supone que deben estar. (Una o dos veces al año)
Damorg
fuente