<?xml version="1.0" encoding="UTF-8"?><rss version="2.0">
	<channel>
		<title>시스존</title>
		<link>http://nblog.syszone.co.kr</link>
		<description></description>
		
				<item>
			<title><![CDATA[Re:qsub 된 작업이 모두 qw 일때 확인 사항]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=60]]></link>
			<description><![CDATA[gstat -j   로 작업 상태를 확인해보시면 작업오류 원인을 확인해보실수 있을것입니다.]]></description>
			<author><![CDATA[alang]]></author>
			<pubDate>Mon, 12 Dec 2022 14:28:16 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:한대의 서버에 SGE를 설치하는 것]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=59]]></link>
			<description><![CDATA[네 맞습니다.
한대의 서버에도 작업 스케줄링을 위해  스계줄러 구성을  할수 있으며 이경우 관리와 실행 그리고 작업제출노드 설정을 한대에 모두 실행해주시면 됩니다.

NFS 구성할 필요는 없구요..^^]]></description>
			<author><![CDATA[alang]]></author>
			<pubDate>Mon, 12 Dec 2022 14:25:16 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[한대의 서버에 SGE를 설치하는 것]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=58]]></link>
			<description><![CDATA[선생님 안녕하세요.
정말 강같은 글들 덕분에, 많이 배웠습니다. 감사합니다 ㅠㅠ 

저는 한대의 서버에 SGE설치하고 작업 스케줄링 용도로 사용하고 싶습니다.
혹시이런 경우에는 한대의 서버 (서버 A라고 칭함)에

Q1. 마스터 노드와 계산노드를 각각 세팅해야 하는 것일까요?

http://nblog.syszone.co.kr/archives/2061 이 문서를 참고해보자면

1. 서버 A에 관리계정을 만든다.
2. 서버 A에 서비스 포트를 추가한다. 
3. 서버 A에 마스터노드를 설치한다. 
4. 서버 A에 계산노드를 설치한다. 


Q2. 이런 경우에는 NFS 파일 시스템은 건드리지 않아도 되는 것이 맞나요?? 


감사합니다 선생님!]]></description>
			<author><![CDATA[제제]]></author>
			<pubDate>Tue, 06 Dec 2022 11:21:03 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:Re:sge job spreading]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=57]]></link>
			<description><![CDATA[혹시 qconf -msconf에 서 
 np_load_avg를 -slots로 변경하여 빈 node로 잡이 우선 배정되게 설정을 했는데,

job을 던졌을때, 빈노드가 없으면 빈 노드가 생길때까지 queue에서  qw(배정전 대기?) 상태도 대기하는 옵션도 있을까요?]]></description>
			<author><![CDATA[david]]></author>
			<pubDate>Tue, 26 Jul 2022 10:59:36 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[qsub 된 작업이 모두 qw 일때 확인 사항]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=56]]></link>
			<description><![CDATA[우선 지식을 나눠주셔서 감사드립니다.

업무로 인해 SGE 설치를 담당하고 있는데 우여곡절 끝에 SGE는 어찌저찌 설치된 것 같습니다. 

qmaster 1대와 client 2대로 구성되어 있는데 client 중 한 대에서 qsub 커맨드로 example/jobs/simple.sh (sleep 명령어가 적힌 스크립트)를 실행하였습니다.

qstat로 확인 qw 상태여서  echo "sleep 10" | qsub으로 STDIN 상태 job이 생성되었는데 이 역시도 qw 상태입니다.


qmaster와 각 client의 데몬 실행은 모두 확인하였습니다.

SGE 왕 초보다보니 job이 실행되지 않는 이유를 전혀 모르겠습니다. 

확인해야될 사항만이라도 조언 부탁드립니다.

오늘도 좋은 하루되세요!!]]></description>
			<author><![CDATA[SGE왕초보유저]]></author>
			<pubDate>Fri, 01 Jul 2022 11:39:10 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[안녕하세요. ^^]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=55]]></link>
			<description><![CDATA[안녕하세요. 오랜기간 시스템엔지니어공동관리구역의 도움을 많이 받아온 리눅서입니다. 
아직도 사이트를 운영하시는걸로 보아 여전히 현역에 계신가봐요..
이리저리 서핑중에 오랜만에 시스존 사이트를 다시 한번 찾아오게되었어요. 
아무쪼록 앞으로도 좋은 정보 공유 많이 부탁드립니다. 감사합니다.]]></description>
			<author><![CDATA[나그네]]></author>
			<pubDate>Thu, 30 Dec 2021 09:27:40 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:sge job spreading]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=53]]></link>
			<description><![CDATA[오래간 만의 문의사항입니다. 한동안 해당 게시판에 글쓰기가 차단된걸 모르고 방치했었네요. ㅎㅎ
 
스케줄러 설정 중 load_formula 정책을 변경하여 slots 의 여유가 많은 서버 순으로 작업을 분배 시킬 수 있습니다. 

1. 우선 각 호스트 별로 보유 중인 slots 수를 속성에 지정해 준다.

qconf -aattr exechost complex_values "slots=10" 


2. 스케줄러 설정 변경 

아래는 기본 설정입니다. 

# qconf -msconf

queue_sort_method                 load
load_formula                      np_load_avg

위 부분을 ..

queue_sort_method                 load
load_formula                      -slots

으로 변경 (비워있는 slots 적은 순서로 할당)

만일 비워 있는 slot 을 우선적으로 채우고자 한다면 
아래와 같이 변경하시면 됩니다. 

queue_sort_method                 load
load_formula                      slots

참고로 SGE 6.x 의 경우 PE 와 함께 사용할 경우.. 이 부분이 적용되지 않을수도 있습니다. 
이때는 SGE 8.x 로 업그레이드하셔야 하고요..]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Fri, 20 Dec 2019 13:47:33 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:SGE parallel environment 와 parallel job , slot 에 대해]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=49]]></link>
			<description><![CDATA[네..안녕하세요.  SGE 운영을 업무로 맡고 계시는 군요. 

일단 이해하고 계신 부분이 모두 맞습니다. 

slot 은 기본적으로 job 에 할당되는 core 수라고 보시면 됩니다. 다만 무조건 SGE 의 slot 이 서버의 
core 와 같아야 하는 것은 아니고요. 일반적으로 HPC(mpi) 와 같은 작업은 slot 과 core 를 같게 해야 
불필요한 processor 의 time sharing 을 피할 수 있습니다. 

다만, GUI 프로그램과 같이 할당된 core를 해당 job 이 끝날때까지 계속  점유하는 형태가 아니라면 
qconf -mq  에서 각 서버의 slot 수를 core 의 1.5~2 배 정도 잡는 경우도 있습니다. 

parallel environment 는 분산 시스템에서 slot 을 어떻게 할당할지를 정의하는 설정입니다. 

pe 설정중 가장 중요한 부분이 allocation rule 인데 해당 설정 값마다 core 를 분산 시키는 방식이 달라
집니다. 

- $pe_slots   :  모든 core 가 같은 서버에서 할당되어야 함.  (SMP 방식에 적용)   
- fill_up : 처음 할당되는 서버의 유휴 중인 모든 core 를 할당한 후 부족하면 다음 서버의 core 를 할당  
- round_robin : 서버당 모조건 1개 core 씩 할당 ( A,B,C, D 서버가 4대 인데, 요구한 slot 수가 8일 경우 ..
서버당 2core 씩 할당되겠죠..순서는 ABCDABCD 순으로 ..)
- 1 : 서버당 모조건 1개 core 할당 ( round_robin 은 서버 수 보다 많은 slot 을 요구하면, 서버 순으로 
한바퀴 돌고 처음 서버 slot 을 다시 추가하지만, allocation rule 에 정수가 적힌 경우는 해당 수를 초과할 수 없습니다. 
즉..서버가 4대 인데 8개 slot 을 할당하면 작업이 들어가지 않겠죠..
- 2 : 서버당 모조건 2개 core 할당 
 : 서버당 모조건 n 개 core 할당


PE 는 multi processor 를 이용하는 작업 환경에서 작업에 대해 서버의 processor 를 어떻게 할당할지 지정하는 설정이라 
매우 중요한 설정 부분입니다. 

그럼..]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Mon, 28 May 2018 12:30:40 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:Re:질문이있습니다.]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=48]]></link>
			<description><![CDATA[안녕하세요!!  매번 친절하고 자세한 답변 감사드립니다 !!

qalter -q 로 바꾸면 해당 잡을 qstat -j 로 확인해 보면 hard queue list에는 실제로 바뀐 queue로 변경 되지만 

qstat -u "*" -q [바꾼queue] 로 확인 했을 때 확인이 안되고 기존의 qstat -u "*" -q [기존 queue] 로만 확인이 되서요!

실제로 qalter -q로 바꿔도 바꾼 queue가 비어 있음에도 job이 안들어 가는 것을 확인 했습니다 .. ㅜㅜ

위에 글 처럼 qlater -l -qname=[바꾼 queue]로 하면 정상적으로 job이 바뀌고 job이 들어 가구요 .. 

제가 잘못하고 있는게 있을 까요 ㅜㅜ ?]]></description>
			<author><![CDATA[김창수]]></author>
			<pubDate>Fri, 25 May 2018 18:09:36 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[SGE parallel environment 와 parallel job , slot 에 대해]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=47]]></link>
			<description><![CDATA[안녕하세요! sge를 관리하는 업무를 맡게 된 사회 초년생 입니다. ㅜ  

정말 sge대해서 물어볼 만한 곳이 많이 없는 것 같습니다 ㅜㅜ 염치 불구 하고 궁금한 점을 여쭤볼까 합니다. 메뉴얼을 봐도 영어인지라 정확하게 이해를 못하겠어서요 ㅜ

제목에 쓰여진 것 처럼 SGE parallel environment 와 parallel job , slot 각 각의 개념이 잘 안잡혀서 그러는데 각각의 개념을 간단하게 설명 해 주시면 매우 감사하겠습니다 ㅜㅜ

제가 이해한 바로는,

일단 slot을 처음에 노드 지정할 때 core갯수 만큼 설정하는것이 좋다고 하던데,

만약 실행노드에 pe를 설정하고 job을 제출할 때, slot을 4로 준다는 것의 의미가

40코어인 노드가 있고, 40슬롯을 할당 했다고 한다면,

4코어를 이용하여 job을 병렬 처리하여 작업 하겠다는 뜻이 맞는건지요??


그리고 만약 여러 노드를 하나의 큐로 지정을 했다면, 예를 들어 all.q에 노드가 10개가 있으면

한개의 커다란 job을 10개의 노드에 분산시켜 처리를 할 수도 있는건가요?

현재는 10개의 job이 있다고 한다면 각각의 개별적인 job이 10개의 노드 중 빈 노드에 들어가게 끔 설정 되어 있습니다.
(ex: 1번 job은 1번 노드에, 2번 잡은 3번 노드에, 3번 잡은 7번 노드에........)

질문을 잘 이해 하셨는지 모르겠습니다 ㅜㅜ 답변 해주시면 정말 감사하겠습니다!!]]></description>
			<author><![CDATA[김창수]]></author>
			<pubDate>Fri, 25 May 2018 17:56:55 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:질문이있습니다.]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=46]]></link>
			<description><![CDATA[안녕하세요. 근래 질문이 자주 없어서 "문의사항" 을 못 보았네요. ㅎㅎ 이리 저리 바쁘기도 했지만요..
답변이 너무 늦었네요. 

grid engine 의 resource 에서 hard 와 soft 의 개념은 아래와 같습니다. 

Hard :  작업이 hard 로 지정된 resource 를 초과할 경우 강제 종료됩니다. 
Soft : 작업이 sotf 로 지정된 resource 를 초과해도 종료되지 않습니다. 
다만, 해당 시스템이 해당 자원이 부족해 지면 우선 종료가 됩니다. 

hard queue 는 일반적으로 submit scripts 작성 시 -q 옵션으로 특정 queue 를 지정할 경우 지정 된 queue는
hard_queue_list 에 포함되지요 

만일 작업 제출 시 qsub -q all.q   이런 식으로 작업을 제출하셨다면 all.q 가 해당작업의 hard_queue_list 에 
포함이 됩니다. 다만, submit scripts 내용에 -q 가 없고 qsub 명령 옵션에도 -q 없이 그냥 작업 제출하면 해당 작업에 대해서는
hard queue 는 없는 거지요.  쉽게 qstat -j  | grep hard_queue_list   로 확인 가능합니다.   

참고로 submit scripts 에서 -masterq 를 정의해 두면 master hard queue_list 에 해당 서버가 포함되는 거고요..

그리고, qalter -q   했을때 queue 가 변경되지 않는 이유는 저도 잘...모르겠습니다. 
저는 언제나 잘 변경이 되었던 지라...제가 수행하는 방식은 아래와 같습니다. 혹시 다른 점이 있으신지 확인해 보심 좋을듯 하네요. 


[alang@GCT3DLM01 ~]$ qstat -f
queuename                      qtype resv/used/tot. load_avg arch          states
---------------------------------------------------------------------------------
cdp.q@GCT3GPU01                BIP   0/0/8          0.13     lx-amd64      
---------------------------------------------------------------------------------
cdp.q@GCT3GPU02                BIP   0/2/8          0.09     lx-amd64      
   1576 0.50500 JOB_152714 alang        r     05/24/2018 17:17:53     1        
   1578 0.50500 JOB_152715 alang        r     05/24/2018 17:41:40     1        
---------------------------------------------------------------------------------
cdp.q@GCT3L3D01                BIP   0/0/8          0.16     lx-amd64      
---------------------------------------------------------------------------------
gpgpu.q@GCT3DLM01              BIP   0/16/30        13.71    lx-amd64      
   1834 0.60500 acc.3.10.s alang        r     05/25/2018 13:16:25    16        
---------------------------------------------------------------------------------
hpc.q@GCT3HPC01                BIP   0/0/8          0.01     lx-amd64      
---------------------------------------------------------------------------------
hpc.q@GCT3HPC02                BIP   0/0/8          0.02     lx-amd64      

############################################################################
 - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS
############################################################################
   1835 0.60500 acc.3.9.sh alang        qw    05/25/2018 13:12:29    16        
   1836 0.60500 acc.3.6.sh alang        qw    05/25/2018 13:12:29    16        
   1837 0.60500 acc.3.4.sh alang        qw    05/25/2018 13:12:29    16        
   1813 0.51167 hostname   alang        qw    05/25/2018 13:04:23     2

/// 1813  작업을 cdp.q 에서 gpgpu.q 로 변경함. 
        
[alang@GCT3DLM01 ~]$ qstat -j 1813 | grep hard_queue
hard_queue_list:            cdp.q

[alang@GCT3DLM01 ~]$ qalter -q gpgpu.q 1813
modified hard queue list of job 1813

[alang@GCT3DLM01 ~]$ qstat -j 1813 | grep hard_queue
hard_queue_list:            gpgpu.q



그럼..즐거운 주말 보내세요.]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Fri, 25 May 2018 13:07:57 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[질문이있습니다.]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=45]]></link>
			<description><![CDATA[안녕하세요 질문이 있어 글 남깁니다 .

sge 개념중에 hard resource가 있고 hard queue가 있는데 정확히 무었을 의미하는지 잘 모르겠어서요 ㅠ

qsub으로 job을 제출 한 뒤에 qw 상태에서 다른 큐로 제출한 job을 변경하고 싶어서

qalter -q [ 바꾸고 싶은 queue ] jobnumber 이렇게 했는데 원하던 큐로 이동이 안되서요!

qalter -l qname=[바꾸고싶은 queue] 하면 이동이 되는데 왜 qalter -q로 하는것은 이동이 안되는지 궁금합니다 !]]></description>
			<author><![CDATA[김창수]]></author>
			<pubDate>Fri, 18 May 2018 10:35:31 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:sge job 들어간 노드 확인]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=44]]></link>
			<description><![CDATA[안녕하세요. 답글이 많이 늦었네요. 근래 외부 일들이 많아서...^^;;;;
작업 제출 시 실제 작업이 할당된 서버를 찾는 대표적인 명령은 qstat 입니다. 

아래와 같이 qstat 나 qstat -f  를 통해 쉽게 확인이 가능합니다. 


[alang@GCT3GPU02 ~]$ qstat
job-ID  prior   name       user         state submit/start at     queue                          slots ja-task-ID 
-----------------------------------------------------------------------------------------------------------------
    538 0.31086 JOB-180412 alang        r     04/12/2018 10:33:58 hpc.q@GCT3HPC02                    4        
    539 0.31086 JOB-180412 alang        r     04/12/2018 10:36:58 gpgpu.q@GCT3GPU02                  4        
    540 0.00000 JOB-180412 alang        qw    04/12/2018 10:38:13


[alang@GCT3GPU02 ~]$ qstat -f
queuename                      qtype resv/used/tot. load_avg arch          states
---------------------------------------------------------------------------------
cdp.q@GCT3L3D01                BIP   0/0/8          0.11     lx-amd64      
---------------------------------------------------------------------------------
gpgpu.q@GCT3GPU01              BIP   0/0/8          -NA-     lx-amd64      au
---------------------------------------------------------------------------------
gpgpu.q@GCT3GPU02              BIP   0/4/8          0.55     lx-amd64      
    539 0.31086 JOB-180412 alang        r     04/12/2018 10:36:58     4        
---------------------------------------------------------------------------------
hpc.q@GCT3HPC01                BIP   0/2/8          0.02     lx-amd64      
    540 0.31086 JOB-180412 alang        r     04/12/2018 10:38:28     2        
---------------------------------------------------------------------------------
hpc.q@GCT3HPC02                BIP   0/6/8          2.92     lx-amd64      
    538 0.31086 JOB-180412 alang        r     04/12/2018 10:33:58     4        
    540 0.31086 JOB-180412 alang        r     04/12/2018 10:38:28     2]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Thu, 12 Apr 2018 10:42:06 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[sge job 들어간 노드 확인]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=43]]></link>
			<description><![CDATA[안녕하세요 궁금한 것이 있어 여쭈어 봅니다.

qsub 명령어를 이용하여 job을 submit 할때에, queue를 지정하여 제출했을  경우, 해당 큐에 어느 노드에 job이 들어 갔는지 확인 할 수 있는 방법이 존재하는지 궁금해 글남깁니다. 

감사합니다!]]></description>
			<author><![CDATA[이진수]]></author>
			<pubDate>Wed, 14 Mar 2018 11:36:04 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:Re:SGE 관련해 도움을 주셨으면 합니다..!]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=42]]></link>
			<description><![CDATA[오류가 나는 부분을 인지하고 그것을 수정해야 하는 것은 맞지만 

실제로 오류가 났다가 다시 실행 하면 잘 실행되는 경우가 있더라구요 ... 아마도 메모리나 cpu에 과부하가 생겨서 오류가 나는듯 한데 ㅜ  그래서 그 원인이 뭔지 정확하게 알지 못해서 질문 드렸는데 

root계정을 이용하여 해결 할 수가 있겠군요!!  정말 감사드립니다. 정말 이렇게 친절하게 답변 달아주실줄 몰랐습니다 ^^ 새해 복 많이 받으시길 바랍니다!]]></description>
			<author><![CDATA[김창수]]></author>
			<pubDate>Mon, 12 Feb 2018 11:12:53 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:SGE 관련해 도움을 주셨으면 합니다..!]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=41]]></link>
			<description><![CDATA[안녕하세요.  qstat  -f  확인 시 특정 노드의 E 로 표시되는 것은 해당 Queue 노드 에 제출된 작업이 비정상적 오류에 의해 중지 되었을때 나타납니다. 

이 경우 관리자가 qmod -c 로 반드시 clear 를 시켜 주어야 합니다. 

gridengine 자체에서 이것을 자동으로 clear 시켜주는 방법에 대해서는 저도 생소하네요. 

주관적인 견해에서는 E 가 발생하면 그럴만한 이유가 있는것이고, 이것을 찾아 해결을 해야할 문제라고 생각합니다. 

만일 자동으로 clear 를 시켜주면 오류에 대한 인지가 어려울듯 보이네요. 

아무튼..gridengine 상에서 자동으로 clear 하는 방법이 있는지는 모르겠지만..해당 효과를 구현하는 것은 어렵지 않다고 보이네요. 

root 계정으로  qmod -c "*" 명령 구문을 매분 혹은 5분 마다 실행되도록 조치하는 것입니다. 

# crontab -e
*/5 * * * *  qmod -c "*"
# service crond restart]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Sun, 11 Feb 2018 19:28:45 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[SGE 관련해 도움을 주셨으면 합니다..!]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=40]]></link>
			<description><![CDATA[안녕하세요 클러스터링 쪽에 관심이 많은 한 청년입니다.

지금 실행 노드가 5개 정도 있는데요 가끔씩 노드의 상태가 E로 변하는데 그럴때마다 qmod로 노드의 에러를 초기화 하는 방법 말고 자동으로

인식해서 노드를 초기화 하는 방법이 있는지 궁금해 질문을 남깁니다. 감사합니다!]]></description>
			<author><![CDATA[김창수]]></author>
			<pubDate>Tue, 06 Feb 2018 14:59:10 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:Re:안녕하세요! sge관련해서 궁금한 것이 있습니다!]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=39]]></link>
			<description><![CDATA[덕분에 문제점이 해결 되었습니다! 

정말 바쁘실텐데 시간 내어 답변해주셔서 감사드립니다. 

곧있으면 설날인데 새해 복 많이 받으시고 올해 좋은 일만 가득 하시길 바라겠습니다!]]></description>
			<author><![CDATA[이진수]]></author>
			<pubDate>Mon, 05 Feb 2018 08:55:55 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:안녕하세요! sge관련해서 궁금한 것이 있습니다!]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=38]]></link>
			<description><![CDATA[안녕하세요. 매번 궁금한 것이 생길때마다 자주 방문하는것 같습니다. 정말 대단하십니다.
다름이 아니라 sge 관련해서 궁금한 것이 있어서 이렇게 질문 드립니다.
제가 마스터 노드와 계산 노드 둘다 설치를 완료하고 관리자 계정으로 qsub을 하면 job이 정상적으로 들어가지만 root나 다른 계정으로 qsub을 실행하면 정상적으로 job이 들어가지 않는것 같습니다. 해당 에러 로그를 보면 error: can't chdir to /root: Permission denied 이렇게 나옵니다. root에서 qsub할때 -cwd 옵션을 주고 하면 실행이또 됩니다. 어떻해야 다른 계정에서도 정상적으로 qsub이 잘 실행 될까요 ..? 염치 불구하고 질문 드립니다! 

안녕하세요. 

문의하신 에러 내용은 작업이 /root 디렉토리에서 수행이 되는데 해당 디렉토리 접근 권한이 없거나 /root 디렉토리가 실제 작업 디렉토리가 아닌 경우에 주로 발생합니다.  (error: can't chdir to /root: Permission denied )

만일 root 계정으로 /home/userid/testjob 디렉토리 밑에 작업 데이터나 실행파일을 놓고, 해당 위치에서 qsub를  실행한다고 가정했을때 ..
#$ -cwd 나 
#$ -wd /home/userid/testjob 

와 같은 옵션이 없다면 기본적으로 /root (계정의 기본 홈디렉토리) 에서 작업이 수행이 됩니다. 단 이때 /root 밑에 job submit script 에 포함된 작업 파일이 없다면..
문제가 발생하겠죠..

일반적으로 qsub 는 해당 작업 디렉토리 밑에서 주로 하게 됩니다. 그럴 경우는 -cwd 옵션을 붙여 주셔야 합니다. 
qsub 명령 수행을 실제 작업 디렉토리 내에서 하지 않는 다고 하면 -wd 옵션으로 실제 작업 디렉토리가 어딘지를 반드시 정의해 주셔야 합니다. 


그럼...안녕히..]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Sat, 03 Feb 2018 20:07:52 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
				<item>
			<title><![CDATA[Re:안녕하세요, 새해 복 많이 받으세요! SGE 와 Ganglia 관련해서 궁금증이 생겼습니다. (사용량 관련)]]></title>
			<link><![CDATA[http://nblog.syszone.co.kr/?kboard_content_redirect=37]]></link>
			<description><![CDATA[안녕하세요. 근래 바빠서 블로그를 잘 살펴보지 못했는데, 여러 질문이 있네요. ^^;;;; 

GridEngine account 의 time 은 크게 wallclock(작업의 수행시간), utime (실제 processor 계산시간), stime (processor 가 계산 중에 여러 이유로 대기하는 시간) 
입니다. 

wallclock 은 100개 core 를 이용한 작업이 10초간 수행되었다면 10초가 count 됩니다. 
utime 은 100개 core 를 이용한 작업 수행할때 100core 모두가 100% 이용률로 순수 계산에  모두 할당(top 에서 us 이용률) 되었다면 이론적으로 1000 이 나올 것입니다. 
stime 은 cpu sys 부분의 이용률에 해당하는 count 가 되겠죠..
다만, 실제 작업이 실행되어 100개의 core 를 잡고는 있지만, 실제 processor 이용률이 10% 밖에 안된다고 하면 100 초로 나오겠죠..

여기서 이 10% 도 연속적인 측정 값이 아니라, 결국 측정 간격 별 값의  평균 부분에 의해 10% 로 표시되는 거지 쉬지 않고 10%를 유지한 것이 
아닙니다. 즉 매 초당 10%,0%,10% 의 이용 추이였는데, ganglia와 같은 모니터링 툴의 interval 이 5초 였다면 그냥 10%로 쭉~표시될 수 있는 것입니다. 
하지만 low 레벨의 processor time count 에서는 이걸 다 계산한다고 보시는 것이 맞을 듯 합니다. (gridengine account 는 여기에 가깝고요)    

사람관점에서 상식적으로 컴퓨터의 이용률을 판단하고자 한다면 ganglia 의 이용률을 보는 것이 맞을 듯 합니다.

즉..100개 core 로 스케줄러에 할당되어 한달간 꾸준이 쉬지 않고 작업이 돌아간거라면 실제 processor 가 low 레벨에서 100개 core 10일치의 계산 처리량이 
일어 났다하더라도 결국 한달간 시스템을 이용한 것이라고 보는게 맞을듯 하네요.  (엔지니어 관점에서 본다면..) 

다른 예를 들면..
H/W 레벨에서 정확한 CPU 계산 처리량을 측정하고자 한다면..kernel level 에서 제공하는 papi 를 이용한 측정이 있습니다. 
HPL 처럼 응용 레벨에서 cpu 의 부동소수점 계산 성능 측정한 flops 수치와 실제  CPU H/W 레벨에서 부동소수점 계산을 처리한  count 와 비교해 보면 거의 
30%~40% 정도 밖에 안되었습니다. (과거 측정 시에.. 요즘은..잘 모르겠지만..ㅎㅎ)

이용률 분석은 아주 많은 일반적 측정 방법 보다는 측정을 하고자 하는 의도(목적)을 먼저 명확히 하고, 거기에 맞는 방법을 선택하는 것이 
의미가 있다고 보이네요. 

그럼..수고하세요.]]></description>
			<author><![CDATA[서진우]]></author>
			<pubDate>Sat, 03 Feb 2018 19:59:53 +0000</pubDate>
			<category domain="http://nblog.syszone.co.kr/?kboard_redirect=3"><![CDATA[시스존 문의사항 (방명록)]]></category>
		</item>
			</channel>
</rss>