Esto probablemente debería ser wiki comunitario. Estoy tratando de llegar a una lista de todas las tareas de administrador de sistemas que deberíamos hacer regularmente porque creo que no estamos haciendo lo suficiente en nuestra empresa. La actitud aquí es que solucionar los problemas es inconveniente, pero no tenemos tiempo para realizar un mantenimiento preventivo o una mejora continua.
Diario:
- intercambiar cinta / unidad de copia de seguridad nocturna
- compruebe que las actualizaciones de antivirus se enviaron a todos los sistemas
Semanal:
- intercambiar cinta / unidad de respaldo semanal
- limpiar archivos temporales de todos los sistemas
- desfragmentar todos los sistemas
Mensual:
- planificar mejoras de infraestructura
- entregar / enviar equipos obsoletos al reciclador electrónico
- reconstruir o reemplazar estaciones de trabajo viejas
- prueba de restauración desde copia de seguridad
Anual:
- reconstruir o reemplazar servidores antiguos
- reemplazar las baterías del UPS
best-practices
maintenance
Scott
fuente
fuente
Respuestas:
Si no tiene tiempo suficiente para realizar el mantenimiento preventivo y dedica la mayor parte de su tiempo a resolver problemas, debe revisar toda su metodología. En lugar de decirte lo que debes hacer cada período, te daré algunas ideas para que no tengas que hacer cosas.
En primer lugar, necesita un buen sistema de monitoreo y la mayor automatización posible. Estos dos elementos deberían liberar más tiempo del que muchos administradores se dan cuenta hasta que lo hayan configurado bien.
Algunas de las cosas que su sistema de monitoreo debería hacer por usted son:
La desfragmentación ni siquiera debería estar en su lista de tareas porque debería ser un proceso automatizado. En el intervalo deseado, haga que el servidor ejecute comprobaciones de disco y una desfragmentación después de un reinicio. Considere vincular esto con un sistema para instalar actualizaciones y parches en cola (que se han probado previamente en una máquina que no es de producción).
Las carpetas temporales también se pueden limpiar con automatización. Creo una aplicación simple que se activa después de un reinicio que espera 10 minutos y luego limpia todas las ubicaciones temporales. La demora es garantizar que no elimine los archivos que pueden ser necesarios para una instalación o actualización que se completa después del reinicio (¡lo aprendí de la manera difícil!).
Una cosa que debe hacer manualmente en cualquier período de tiempo que le convenga es monitorear el sistema de monitoreo y la automatización, solo para estar seguro. Reviso el mío diariamente, pero en realidad no he encontrado un problema durante más de un año.
Cuando inicie su sistema y automatización, asegúrese de tener también un sistema de control de versiones para instalarlo. Puede ser realmente molesto descubrir que el último pequeño truco rompió algo más, pero no puede recordar exactamente qué cambió.
fuente
En Daily, tendría Check Event Logs, ya sea manualmente o mediante un script de algún tipo.
Tal vez mensual podría incluir actualizaciones del sistema operativo?
También diría que anualmente eche un vistazo a dónde está el mantenimiento / garantía en sus servidores.
fuente
Mensual:
Trimestral:
fuente
Aquí hay algunas copias de seguridad mensuales que quizás no haya pensado:
fuente
En Daily, podría recomendar que agregue la suscripción a las conocidas listas de correo de vulnerabilidad de parches y que tenga un proceso de parches / actualizaciones.
Esto solo puede suceder una vez al mes, pero solo se necesita un mensaje perdido sobre la vulnerabilidad de un producto para causar mucha interrupción.
Creo que esto podría resumirse en un par de palabras para que quepan en una línea, si está de acuerdo.
Por cierto; Esta es una gran lista, espero ver su finalización.
fuente
Auditorías internas:
fuente