[클러스터] SGE 기본 사용 방법

Grid Engine의 상태 모니터링

qstat – job/queue 상태를 보여준다

argument가 없으면 현재 running/pending jobs을 보여준다.

-f : 모든 queue의 full list를 보여준다.

-j : pending/running job의 상세한 정보를 보여준다.

-U user : argument에 명시된 사용자가 실행킨 job을 보여준다.

qhost – job/host 상태를 보여준다.

arguments가 없으면 모든 execution host들과 그 host들의 configuration에 대한 정보를 table형태로 보여준다.

-l attr=val : 명시한 속성을 가진 host들만 보여준다.

-j : pending/running job의 상세한 정보를 보여준다.

-q : 각 host의 queue에 대한 자세한 정보를 보여준다.

Grid Engine의 사용

주된 job submit 명령어는 qsub,qrsh,qtcsh 이다. 더 자세한 정보는 submit(1) 과 qtcsh(1) man page를 참조하시오.

qsub – submit scripts

arguments가 없으면, STDIN으로부터 입력값을 받아들인다. (^D 로 input값을 submit한다.)

-cwd : current working directory(현재 directory)로 부터 job을 실행한다.(Default: Home directory)

-v Pass the variable VAR (-V passes all variables)

-o [[hostname]:]path,… : Redirect standard output (Default: Home directory)

-e [[hostname]:]path,… : Redirect standard error (Default: Home directory)

Example:

qsub -cwd -v SOME_VAR -o /dev/null -e /dev/null myjob.sh

보통, qsub은 전형적인 batch job을 submit할 때에 사용된다. 즉, I/O가 file로부터 일어나고 저장된다.

qrsh

qrsh는 host name을 주지 않아도 되는 것만 빼면, rsh명령어와 비슷하게 동작하며, shell script나 executable file(실행가능한 binary file)은 (조건만 맞는다면) grid cluster의 어떠한 node에서도 실행될 수 있다. I/O는 job제출자의 terminal window로 뿌려진다. 기본적으로, 만일 job이 즉시 실행될 수 없는 환경에 있다면, qrsh는 그 job을 queue에 넣어두지 못한다.이 경우 ‘-now no’ flag를 사용하면, qrsh 작업을 queue에 넣어둘 수 있다. I/O는 shell redirect operator를 이용해서 redirect될 수 있다. 예를 들어, uname -a 명령을 실행할 경우:

qrsh uname -a

scheduler가 선택한 grid cluster내의 한 장비의 uname이 작업 제출자의 terminal에 display될 것이다. 이 output을 redirect하기 위해서 아래와 같이 한다.

qrsh uname -a > /tmp/myfile

output이 작업 제출자 host의 /tmp/myfile로 저장될 것이다. 위의 명령이 queuing되도록 하려면:

qrsh -now no uname -a

위 명령을 수행할 만한 적당한 호스트가 당장 없다면(예를 들어, 모든 host의 모든 slot이 꽉 차있는 경우) 위 명령어는 queue에 들어가서 멈추어 있다가, 적절한 호스트가 나타난다면 실행된다. 이런 경우, 명령의 output은 제출자의 terminal에 나타나게 된다.

더 자세한 것은 qrsh(1) man page 를 보시오.

qtcsh

Grid Engine은 tcsh의 변형본은 qtcsh 명령을 갖고 있다. qtcsh는 task file에 등록 되어있는 job을 자동으로 grid cluster에 제출할 수 있다. 더 자세한 것은 qtcsh(1)과 qtask(5) man page를 참조하시오.

< 원본 : http://gridengine.sunsource.net/howto/basic_usage.html >

서진우

슈퍼컴퓨팅 전문 기업 클루닉스/ 상무(기술이사)/ 정보시스템감리사/ 시스존 블로그 운영자

You may also like...

2 Responses

  1. 2024년 9월 15일

    … [Trackback]

    […] Info to that Topic: nblog.syszone.co.kr/archives/2179 […]

  2. 2024년 10월 14일

    … [Trackback]

    […] Information to that Topic: nblog.syszone.co.kr/archives/2179 […]

페이스북/트위트/구글 계정으로 댓글 가능합니다.