시스존 문의사항

Re:SGE 관련해 도움을 주셨으면 합니다..!

작성자
서진우 서진우
작성일
2018-02-11 19:28
조회
8048
안녕하세요. qstat -f 확인 시 특정 노드의 E 로 표시되는 것은 해당 Queue 노드 에 제출된 작업이 비정상적 오류에 의해 중지 되었을때 나타납니다.

이 경우 관리자가 qmod -c 로 반드시 clear 를 시켜 주어야 합니다.

gridengine 자체에서 이것을 자동으로 clear 시켜주는 방법에 대해서는 저도 생소하네요.

주관적인 견해에서는 E 가 발생하면 그럴만한 이유가 있는것이고, 이것을 찾아 해결을 해야할 문제라고 생각합니다.

만일 자동으로 clear 를 시켜주면 오류에 대한 인지가 어려울듯 보이네요.

아무튼..gridengine 상에서 자동으로 clear 하는 방법이 있는지는 모르겠지만..해당 효과를 구현하는 것은 어렵지 않다고 보이네요.

root 계정으로 qmod -c "*" 명령 구문을 매분 혹은 5분 마다 실행되도록 조치하는 것입니다.

# crontab -e
*/5 * * * * qmod -c "*"
# service crond restart