[클러스터] SGE 기본 사용 방법
Grid Engine의 상태 모니터링
qstat – job/queue 상태를 보여준다
argument가 없으면 현재 running/pending jobs을 보여준다.
-f : 모든 queue의 full list를 보여준다.
-j : pending/running job의 상세한 정보를 보여준다.
-U user : argument에 명시된 사용자가 실행킨 job을 보여준다.
qhost – job/host 상태를 보여준다.
arguments가 없으면 모든 execution host들과 그 host들의 configuration에 대한 정보를 table형태로 보여준다.
-l attr=val : 명시한 속성을 가진 host들만 보여준다.
-j : pending/running job의 상세한 정보를 보여준다.
-q : 각 host의 queue에 대한 자세한 정보를 보여준다.
Grid Engine의 사용
주된 job submit 명령어는 qsub,qrsh,qtcsh 이다. 더 자세한 정보는 submit(1) 과 qtcsh(1) man page를 참조하시오.
qsub – submit scripts
arguments가 없으면, STDIN으로부터 입력값을 받아들인다. (^D 로 input값을 submit한다.)
-cwd : current working directory(현재 directory)로 부터 job을 실행한다.(Default: Home directory)
-v Pass the variable VAR (-V passes all variables)
-o [[hostname]:]path,… : Redirect standard output (Default: Home directory)
-e [[hostname]:]path,… : Redirect standard error (Default: Home directory)
Example:
qsub -cwd -v SOME_VAR -o /dev/null -e /dev/null myjob.sh
보통, qsub은 전형적인 batch job을 submit할 때에 사용된다. 즉, I/O가 file로부터 일어나고 저장된다.
qrsh
qrsh는 host name을 주지 않아도 되는 것만 빼면, rsh명령어와 비슷하게 동작하며, shell script나 executable file(실행가능한 binary file)은 (조건만 맞는다면) grid cluster의 어떠한 node에서도 실행될 수 있다. I/O는 job제출자의 terminal window로 뿌려진다. 기본적으로, 만일 job이 즉시 실행될 수 없는 환경에 있다면, qrsh는 그 job을 queue에 넣어두지 못한다.이 경우 ‘-now no’ flag를 사용하면, qrsh 작업을 queue에 넣어둘 수 있다. I/O는 shell redirect operator를 이용해서 redirect될 수 있다. 예를 들어, uname -a 명령을 실행할 경우:
qrsh uname -a
scheduler가 선택한 grid cluster내의 한 장비의 uname이 작업 제출자의 terminal에 display될 것이다. 이 output을 redirect하기 위해서 아래와 같이 한다.
qrsh uname -a > /tmp/myfile
output이 작업 제출자 host의 /tmp/myfile로 저장될 것이다. 위의 명령이 queuing되도록 하려면:
qrsh -now no uname -a
위 명령을 수행할 만한 적당한 호스트가 당장 없다면(예를 들어, 모든 host의 모든 slot이 꽉 차있는 경우) 위 명령어는 queue에 들어가서 멈추어 있다가, 적절한 호스트가 나타난다면 실행된다. 이런 경우, 명령의 output은 제출자의 terminal에 나타나게 된다.
더 자세한 것은 qrsh(1) man page 를 보시오.
qtcsh
Grid Engine은 tcsh의 변형본은 qtcsh 명령을 갖고 있다. qtcsh는 task file에 등록 되어있는 job을 자동으로 grid cluster에 제출할 수 있다. 더 자세한 것은 qtcsh(1)과 qtask(5) man page를 참조하시오.
< 원본 : http://gridengine.sunsource.net/howto/basic_usage.html >
2 Responses
… [Trackback]
[…] Info to that Topic: nblog.syszone.co.kr/archives/2179 […]
… [Trackback]
[…] Information to that Topic: nblog.syszone.co.kr/archives/2179 […]