Recibo errores de R12 Exit Timeout para una aplicación Heroku que ejecuta unicorn y sidekiq. Estos errores ocurren 1-2 veces al día y cada vez que implemento. Entiendo que necesito convertir las señales de apagado de Heroku para que unicorn responda correctamente, pero pensé que lo había hecho en la siguiente configuración de unicornio:
worker_processes 3
timeout 30
preload_app true
before_fork do |server, worker|
Signal.trap 'TERM' do
puts "Unicorn master intercepting TERM and sending myself QUIT instead. My PID is #{Process.pid}"
Process.kill 'QUIT', Process.pid
end
if defined?(ActiveRecord::Base)
ActiveRecord::Base.connection.disconnect!
Rails.logger.info('Disconnected from ActiveRecord')
end
end
after_fork do |server, worker|
Signal.trap 'TERM' do
puts "Unicorn worker intercepting TERM and doing nothing. Wait for master to sent QUIT. My PID is #{Process.pid}"
end
if defined?(ActiveRecord::Base)
ActiveRecord::Base.establish_connection
Rails.logger.info('Connected to ActiveRecord')
end
Sidekiq.configure_client do |config|
config.redis = { :size => 1 }
end
end
Mis registros que rodean el error se ven así:
Stopping all processes with SIGTERM
Unicorn worker intercepting TERM and doing nothing. Wait for master to sent QUIT. My PID is 7
Unicorn worker intercepting TERM and doing nothing. Wait for master to sent QUIT. My PID is 11
Unicorn worker intercepting TERM and doing nothing. Wait for master to sent QUIT. My PID is 15
Unicorn master intercepting TERM and sending myself QUIT instead. My PID is 2
Started GET "/manage"
reaped #<Process::Status: pid 11 exit 0> worker=1
reaped #<Process::Status: pid 7 exit 0> worker=0
reaped #<Process::Status: pid 15 exit 0> worker=2
master complete
Error R12 (Exit timeout) -> At least one process failed to exit within 10 seconds of SIGTERM
Stopping remaining processes with SIGKILL
Process exited with status 137
Parece que todos los procesos secundarios se cosecharon con éxito antes del tiempo de espera. ¿Es posible que el maestro siga vivo? Además, ¿debería el enrutador seguir enviando solicitudes web al banco de pruebas durante el apagado, como se muestra en los registros?
FWIW, estoy usando el complemento de implementación de tiempo de inactividad cero de Heroku ( https://devcenter.heroku.com/articles/labs-preboot/ ).
Respuestas:
Creo que su manejo de señal personalizado es lo que está causando los tiempos de espera aquí.
EDITAR: Me votan en contra por no estar de acuerdo con la documentación de Heroku y me gustaría abordar esto.
Configurar su aplicación Unicorn para capturar y tragar la señal TERM es la causa más probable de que su aplicación se cuelgue y no se cierre correctamente.
Heroku parece argumentar que captar y transformar una señal TERM en una señal QUIT es el comportamiento correcto para convertir un apagado forzado en un apagado elegante.
Sin embargo, hacer esto parece introducir el riesgo de que no se apague en absoluto en algunos casos, la raíz de este error. Los usuarios que experimenten dynos colgantes que ejecutan Unicorn deben considerar la evidencia y tomar su propia decisión basándose en los primeros principios, no solo en la documentación.
fuente