Prolongar el trabajo de PBS

8

Es bastante doloroso descubrir que un trabajo de varios días se eliminará prematuramente debido a un error al establecer el límite de tiempo de pared.

¿Hay alguna manera de cambiarlo para un trabajo PBS en ejecución ?

mbq
fuente

Respuestas:

9

Esto es específico del sistema, pero está buscando el qaltercomando.

Aron Ahmadia
fuente
1
Y por lo general, si usted no tiene la gestión de privilegio en ese sistema, usted sólo será capaz de bajar los recursos, lo que probablemente no es lo que quieres ...
FrenchKheldar
@FrenchKheldar Tengo la impresión de que otorgar este privilegio a los usuarios es bastante común. Por supuesto, puede usarse para abusar de la cola, pero es trivial rastrear tal comportamiento.
mbq
@mbq Supongo que mi experiencia es con máquinas gubernamentales donde supongo que podría haber más restricciones que en otros entornos. Y como un usuario siempre busca acceso a recursos computacionales, definitivamente buscaría en este tipo de escapatoria si esto fuera permitido. Esto significa que podría eludir la cola prioritaria pidiendo menos recursos ...
FrenchKheldar
Interesante, siempre pensé qalterque solo podría aumentar los límites de tiempo antes de que comience el trabajo (que creo que leí en la página del manual).
David Z
2

Póngase en contacto con los administradores de TI a través de su clúster. Sé de personas que han tenido otros problemas, como trabajos que no comienzan. Una vez que nuestro administrador de TI se enteró, se encargaron de ello.

Christopher Bottoms
fuente
2

Para gente perezosa:

qalter -l walltime=<new walltime> <jobid>
mbq
fuente
2

vieja pregunta, pero estoy agregando información adicional para cualquier persona que llegue aquí desde Google

Tenga en cuenta que una vez que un trabajo se ejecuta en TORQUE, cualquier solicitud para alargar el tiempo de la pared se ignorará a menos que el comando u operador ejecute el comando qalter. Para extender el tiempo de la pared de un trabajo en ejecución, debe comunicarse con un administrador. Puede acortar el tiempo de ejecución de sus propios trabajos en ejecución, y si su trabajo no se está ejecutando (en cola o retenido) puede aumentar el tiempo de instalación con qalter.

Cañada
fuente