¿Es posible pausar trabajos enviados a través de qsub?

10

Estoy ejecutando mis trabajos en un pequeño grupo. Los envié a través de qsub. Ahora mis compañeros de laboratorio necesitan recursos con más urgencia que yo, por lo que necesito matar mis trabajos o pausarlos, si es posible.

¿Hay alguna forma de pausar mis trabajos y liberar la CPU, la RAM, etc.?

Soy un usuario normal (sin privilegios de root).

Sibbs Gambling
fuente
1
Puede retener sus trabajos que aún no se ejecutan qhold, pero esto no afecta los trabajos que ya se están ejecutando. Parece que qmodpuede suspender los trabajos en ejecución, pero necesita privilegios de administrador o root.
jofel
Suponiendo que tiene un clúster MOAB: puede suspender su trabajo (si está configurado en consecuencia), pero solo el administrador puede reanudarlo: docs.adaptivecomputing.com/mwm/Content/topics/jobAdministration/…
Ott Toomet

Respuestas:

6

Si los trabajos no han comenzado, puede ponerlos en espera qhold. Use qrlspara reiniciar.

qhold <job ID>
qrls <job ID>

Si ya se están ejecutando, puede usar qsigpara suspender y reanudar trabajos (es posible que necesite permisos adicionales para eso, pregúntele a su administrador si ese es el caso):

qsig -s suspend <job ID>
qsig -s resume <job ID>

Una vez que haya reanudado su trabajo, es posible que deba forzarlo para que se ejecute con qrun

qrun <job ID>

Probado en un sistema SLES 11 SP4 con PBSPro 13.0.2.153173, pero estoy seguro de que debería funcionar con otros sistemas de envío de trabajos por lotes compatibles con POSIX.

Calimo
fuente