시스존 문의사항

SGE parallel environment 와 parallel job , slot 에 대해

작성자
김창수 김창수
작성일
2018-05-25 17:56
조회
6978
안녕하세요! sge를 관리하는 업무를 맡게 된 사회 초년생 입니다. ㅜ

정말 sge대해서 물어볼 만한 곳이 많이 없는 것 같습니다 ㅜㅜ 염치 불구 하고 궁금한 점을 여쭤볼까 합니다. 메뉴얼을 봐도 영어인지라 정확하게 이해를 못하겠어서요 ㅜ

제목에 쓰여진 것 처럼 SGE parallel environment 와 parallel job , slot 각 각의 개념이 잘 안잡혀서 그러는데 각각의 개념을 간단하게 설명 해 주시면 매우 감사하겠습니다 ㅜㅜ

제가 이해한 바로는,

일단 slot을 처음에 노드 지정할 때 core갯수 만큼 설정하는것이 좋다고 하던데,

만약 실행노드에 pe를 설정하고 job을 제출할 때, slot을 4로 준다는 것의 의미가

40코어인 노드가 있고, 40슬롯을 할당 했다고 한다면,

4코어를 이용하여 job을 병렬 처리하여 작업 하겠다는 뜻이 맞는건지요??


그리고 만약 여러 노드를 하나의 큐로 지정을 했다면, 예를 들어 all.q에 노드가 10개가 있으면

한개의 커다란 job을 10개의 노드에 분산시켜 처리를 할 수도 있는건가요?

현재는 10개의 job이 있다고 한다면 각각의 개별적인 job이 10개의 노드 중 빈 노드에 들어가게 끔 설정 되어 있습니다.
(ex: 1번 job은 1번 노드에, 2번 잡은 3번 노드에, 3번 잡은 7번 노드에........)

질문을 잘 이해 하셨는지 모르겠습니다 ㅜㅜ 답변 해주시면 정말 감사하겠습니다!!