Considere este escenario (cualquier comparación con situaciones del mundo real es puramente por accidente):
- 3:07 am : llamada de soporte entrante " Algo en producción cayó, ¡necesito tu ayuda! ".
- 3:12 am : conectado al sistema (inicio de sesión aceptado) ... y no hay tiempo para el café.
- 3:15 am : por suerte, de inmediato podrías detectar el problema a través de algún mensaje de error en alguna parte.
- 3:17 am : use su caja de herramientas SCM para obtener el código, solucionar el problema, probarlo, genial ... ¡mi solución funciona!
- 3:20 am : póngase en contacto con el equipo
DevOps para enviar la solución y volver a poner en marcha la producción. - 3:21 am : bandera roja ... " Para respetar los cuatro ojos , necesitamos 2 ojos más para obtener la aprobación de esta solución ".
- 3:22 am : ggggrrrreat, ahora qué, ¿a quién más podemos llamar (= despertar a algún gerente)?
Si implementó algún procedimiento de aprobación similar a mi respuesta a " ¿Cuáles son las posibles implementaciones (o ejemplos) del principio de los cuatro ojos? ", Entonces no tiene suerte ... estas son sus opciones:
- Su solución se bloqueará (léase: la producción se reducirá) hasta que se involucren 2 ojos más.
- Encuentra una manera de evitar los ojos perdidos
Entonces, ¿cómo implementar el principio de cuatro ojos para soluciones de emergencia? ... ¿Para que la producción esté en funcionamiento lo antes posible, es decir, alrededor de las 3:25 am ... Y para que también pueda cerrar la llamada (y volver al lugar de donde vino)?
configuration
four-eyes
Pierre.Vriens
fuente
fuente
Respuestas:
En el mundo SCM en el que estoy más familiarizado, el escenario anterior generalmente se aborda mediante lo que se denomina el " procedimiento de lista de aprobación abreviada " .
Aquí hay un plano de ello:
Con tal solución, la llamada puede cerrarse alrededor de las 3:23 am ... ya que no habrá más bandera roja a las 3:21 am ... ggggrrreat, hora de que una cerveza celebre mi arreglo para que la producción vuelva a funcionar (en lugar de café) ... y los dedos cruzan las aprobaciones de correos pendientes vendrán pronto ...
fuente
En el caso de arreglos de emergencia fuera del horario de atención, es más práctico requerir menos cierre de sesión para los cambios que su procedimiento normal. En general, puede implementar una solución y luego realizar aprobaciones posteriores al siguiente día hábil. Si la solución no se aprueba, se puede revertir y reemplazar con una solución permanente.
Durante una situación de interrupción, la prioridad número uno debe ser restaurar el servicio. Si su organización no reconoce este proceso relajado durante una interrupción, entonces sí, su única opción es comenzar a despertar a más personas para que cierren la sesión.
fuente