Estoy viendo procesos en mi SGI Altix 450 que ejecutan SLES 10.1 aparentemente dejan de funcionar (es decir, no proporcionan más resultados en sus registros durante horas). En este punto, quiero eliminar el proceso ofensivo para poder reiniciarlo. Arriba muestra que el proceso está en el estado (R). Aunque cuando intento matarlo no pasa nada. Incluso cuando uso kill -9 todavía persiste. En este caso, ¿qué puedo hacer además de reiniciar la máquina?
9
Respuestas:
Es posible que el proceso se cancele pero esperando que el padre recolecte su valor de retorno. En ese caso, después de su muerte, estaría en estado 'Z' y no 'R'. En ese caso, debe encontrar el
ppid
proceso mediante elps
comando y eliminar el proceso principal también (si está realmente seguro de que no causará ningún problema).El otro caso podría ser que, por alguna razón, el proceso se reinicia después de ser asesinado como tty. En ese caso, la identificación del proceso debería cambiar cada vez que elimines -9. Vea si la ID del proceso cambia cada vez que intenta matarlo.
fuente
El proceso está esperando algún recurso del sistema, ¿tal vez NFS? eso no le permite "soltarse". Me encantaría escuchar algunas soluciones a esto más allá de la mía ...
reinicie la caja o deje que el proceso se asiente.
Me pregunto si podría 'PARAR' el proceso a través de kill -STOP {PID} para evitar que consuma más CPU.
Reiniciarlo debería ser posible incluso con otro proceso detenido, pero puede requerir un puerto de lista o un segmento de memoria compartida que todavía esté en uso por el otro proceso.
fuente
ls
comando en un montaje s3fs. Ells
proceso no matará inclusokill -9
hasta que fuerce el desmontaje conumount -l
¿Ya has revisado dmesg? He visto esto después de un kernel panic; la única forma de recuperarse es reiniciar (preferiblemente pronto) y luego obtener un kernel parcheado.
Los procesos normales que no se pueden matar estarán en el estado D, no en R.
fuente