Re:질문이있습니다.
작성자
서진우
작성일
2018-05-25 13:07
조회
8402
안녕하세요. 근래 질문이 자주 없어서 "문의사항" 을 못 보았네요. ㅎㅎ 이리 저리 바쁘기도 했지만요..
답변이 너무 늦었네요.
grid engine 의 resource 에서 hard 와 soft 의 개념은 아래와 같습니다.
Hard : 작업이 hard 로 지정된 resource 를 초과할 경우 강제 종료됩니다.
Soft : 작업이 sotf 로 지정된 resource 를 초과해도 종료되지 않습니다.
다만, 해당 시스템이 해당 자원이 부족해 지면 우선 종료가 됩니다.
hard queue 는 일반적으로 submit scripts 작성 시 -q 옵션으로 특정 queue 를 지정할 경우 지정 된 queue는
hard_queue_list 에 포함되지요
만일 작업 제출 시 qsub -q all.q 이런 식으로 작업을 제출하셨다면 all.q 가 해당작업의 hard_queue_list 에
포함이 됩니다. 다만, submit scripts 내용에 -q 가 없고 qsub 명령 옵션에도 -q 없이 그냥 작업 제출하면 해당 작업에 대해서는
hard queue 는 없는 거지요. 쉽게 qstat -j | grep hard_queue_list 로 확인 가능합니다.
참고로 submit scripts 에서 -masterq 를 정의해 두면 master hard queue_list 에 해당 서버가 포함되는 거고요..
그리고, qalter -q 했을때 queue 가 변경되지 않는 이유는 저도 잘...모르겠습니다.
저는 언제나 잘 변경이 되었던 지라...제가 수행하는 방식은 아래와 같습니다. 혹시 다른 점이 있으신지 확인해 보심 좋을듯 하네요.
[alang@GCT3DLM01 ~]$ qstat -f
queuename qtype resv/used/tot. load_avg arch states
---------------------------------------------------------------------------------
cdp.q@GCT3GPU01 BIP 0/0/8 0.13 lx-amd64
---------------------------------------------------------------------------------
cdp.q@GCT3GPU02 BIP 0/2/8 0.09 lx-amd64
1576 0.50500 JOB_152714 alang r 05/24/2018 17:17:53 1
1578 0.50500 JOB_152715 alang r 05/24/2018 17:41:40 1
---------------------------------------------------------------------------------
cdp.q@GCT3L3D01 BIP 0/0/8 0.16 lx-amd64
---------------------------------------------------------------------------------
gpgpu.q@GCT3DLM01 BIP 0/16/30 13.71 lx-amd64
1834 0.60500 acc.3.10.s alang r 05/25/2018 13:16:25 16
---------------------------------------------------------------------------------
hpc.q@GCT3HPC01 BIP 0/0/8 0.01 lx-amd64
---------------------------------------------------------------------------------
hpc.q@GCT3HPC02 BIP 0/0/8 0.02 lx-amd64
############################################################################
- PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS
############################################################################
1835 0.60500 acc.3.9.sh alang qw 05/25/2018 13:12:29 16
1836 0.60500 acc.3.6.sh alang qw 05/25/2018 13:12:29 16
1837 0.60500 acc.3.4.sh alang qw 05/25/2018 13:12:29 16
1813 0.51167 hostname alang qw 05/25/2018 13:04:23 2
/// 1813 작업을 cdp.q 에서 gpgpu.q 로 변경함.
[alang@GCT3DLM01 ~]$ qstat -j 1813 | grep hard_queue
hard_queue_list: cdp.q
[alang@GCT3DLM01 ~]$ qalter -q gpgpu.q 1813
modified hard queue list of job 1813
[alang@GCT3DLM01 ~]$ qstat -j 1813 | grep hard_queue
hard_queue_list: gpgpu.q
그럼..즐거운 주말 보내세요.
답변이 너무 늦었네요.
grid engine 의 resource 에서 hard 와 soft 의 개념은 아래와 같습니다.
Hard : 작업이 hard 로 지정된 resource 를 초과할 경우 강제 종료됩니다.
Soft : 작업이 sotf 로 지정된 resource 를 초과해도 종료되지 않습니다.
다만, 해당 시스템이 해당 자원이 부족해 지면 우선 종료가 됩니다.
hard queue 는 일반적으로 submit scripts 작성 시 -q 옵션으로 특정 queue 를 지정할 경우 지정 된 queue는
hard_queue_list 에 포함되지요
만일 작업 제출 시 qsub -q all.q 이런 식으로 작업을 제출하셨다면 all.q 가 해당작업의 hard_queue_list 에
포함이 됩니다. 다만, submit scripts 내용에 -q 가 없고 qsub 명령 옵션에도 -q 없이 그냥 작업 제출하면 해당 작업에 대해서는
hard queue 는 없는 거지요. 쉽게 qstat -j | grep hard_queue_list 로 확인 가능합니다.
참고로 submit scripts 에서 -masterq 를 정의해 두면 master hard queue_list 에 해당 서버가 포함되는 거고요..
그리고, qalter -q 했을때 queue 가 변경되지 않는 이유는 저도 잘...모르겠습니다.
저는 언제나 잘 변경이 되었던 지라...제가 수행하는 방식은 아래와 같습니다. 혹시 다른 점이 있으신지 확인해 보심 좋을듯 하네요.
[alang@GCT3DLM01 ~]$ qstat -f
queuename qtype resv/used/tot. load_avg arch states
---------------------------------------------------------------------------------
cdp.q@GCT3GPU01 BIP 0/0/8 0.13 lx-amd64
---------------------------------------------------------------------------------
cdp.q@GCT3GPU02 BIP 0/2/8 0.09 lx-amd64
1576 0.50500 JOB_152714 alang r 05/24/2018 17:17:53 1
1578 0.50500 JOB_152715 alang r 05/24/2018 17:41:40 1
---------------------------------------------------------------------------------
cdp.q@GCT3L3D01 BIP 0/0/8 0.16 lx-amd64
---------------------------------------------------------------------------------
gpgpu.q@GCT3DLM01 BIP 0/16/30 13.71 lx-amd64
1834 0.60500 acc.3.10.s alang r 05/25/2018 13:16:25 16
---------------------------------------------------------------------------------
hpc.q@GCT3HPC01 BIP 0/0/8 0.01 lx-amd64
---------------------------------------------------------------------------------
hpc.q@GCT3HPC02 BIP 0/0/8 0.02 lx-amd64
############################################################################
- PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS
############################################################################
1835 0.60500 acc.3.9.sh alang qw 05/25/2018 13:12:29 16
1836 0.60500 acc.3.6.sh alang qw 05/25/2018 13:12:29 16
1837 0.60500 acc.3.4.sh alang qw 05/25/2018 13:12:29 16
1813 0.51167 hostname alang qw 05/25/2018 13:04:23 2
/// 1813 작업을 cdp.q 에서 gpgpu.q 로 변경함.
[alang@GCT3DLM01 ~]$ qstat -j 1813 | grep hard_queue
hard_queue_list: cdp.q
[alang@GCT3DLM01 ~]$ qalter -q gpgpu.q 1813
modified hard queue list of job 1813
[alang@GCT3DLM01 ~]$ qstat -j 1813 | grep hard_queue
hard_queue_list: gpgpu.q
그럼..즐거운 주말 보내세요.