인텔 Xeon Phi 설치 가이드 Vers.1

1. Introduction

인텔 제온 파이는 GPU와 같은 coprocessor이다.
하지만, GPU와 달리 기존의 소스코드를 별도의 수정작업 없이 그대로 사용할 수 있는 장점과
디바이스 하나당 이론치 1TB flops(e5-2690 3개에달하는)고성능을 자랑한다고 한다.
(실제 성능 분석 자료에 의하면 e5-2680×2의 퍼포먼스를 상회한다고 한다.)
아래는 현재 출시되어져 있는 Intel Xeon Phi 제품군과 간략한 하드웨어 스펙이다.
Intel Xeon Phi hardware Spec.

3100 series
1.000GHz, 6GB Memory, 56core

5100 series
1.053GHz, 8GB Memory, 60core

7100 series
1.053GHz, 16GB Memory, 61core

2. Cluster Setup

Intel Xeon Phi가 장착된 서버의 구성은 다음과 같은 구성을 하게 된다.

Intel MPSS package설치 -> 드라이버 설치 및 flash업데이트 -> Intel Xeon Phi 설정 초기화 ->
Bridge를 이용하여 각 디바이스에 IP할당 -> 파일시스템 마운트 -> MPSS서비스 시작

Intel Manycore Platform Software Stack은 인텔에서 xeon phi 사용을 위해 필요한 드라이버 및
각종 유틸리티를 모아둔 소프트웨어 패키지라고 보면 된다.
인텔 홈페이지에서 mpss_gold_update_3 을 검색하여 다운받도록 한다.
tar xvf mpss_gold_update_3-2.1.6720-13-rhel-6.2.tar
cd mpss_gold_update_3
rpm -ivh *.rpm

설치가 끝나면 flash update와 MPSS service 설정을 해야 한다.
작업 전에 재부팅 과정이 필요하므로, mpss서비스를 off상태로 둔다.
인피니밴드가 있을 경우, ofed-mic도 off상태로 두도록 한다.

chkconfig –level 345 mpss off
chkconfig –level 345 ofed-mic off

이후 재부팅을 하고, 상태를 체크한다.

/opt/intel/mic/bin/micinfo | grep –i “coprocessor stepping”
service mpss
status

혹시나 mpss서비스가 실행중이라면 정지하고, xeon phi를 리셋시킨다.

micctrl -r
micctrl -w

이후 초기화를 시킨다.(default.conf,micX.conf생성)
micctrl –initdefaults

그리고 flash update를 한다.
/opt/intel/mic/bin/micflash -update
/opt/intel/mic/flash/EXT_HP2_SMC_Bootloader_1_8_4326.css_ab \
-device 0
-noreboot
/opt/intel/mic/bin/micflash -update \
-device 0
-noreboot
reboot

브릿지 설정
micctrl –addbridge=br0 –type=External –ip=$HostIP –netbits=24
mic0
($HostIP)는 브릿지의 아이피

아이피 할당
micctrl –network=static –bridge=br0 –ip=$MIC0IP –netbits=24 mic0
($MIC0IP)는 mic아이피

MTU 설정
echo “MTU=$MTUSIZE” >>
/opt/intel/mic/filesystem/mic0/etc/sysconfig/network/ifcfg-mic0

위의 내용은 /etc/sysconfig/mic/default.conf, micX.conf 파일에서도 아래와 같은 내용으로 수정 가능하다.

Bridge br0 External 192.168.0.1 24 9000(default.conf)
Network StaticBridge
br0 192.168.0.2 yes(micX.conf)

micctrl –resetconfig

네트워크 재시작
service network restart

위 단계까지 설정이 정상적으로 완료되었다면 /etc/hosts 에 다음과 같이 등록한다.
#Xeon Servers
192.168.0.1 node1
#MICs
192.168.0.2
node1-mic0
192.168.0.3 node1-mic1

각 MIC에서 서버와 다른 MIC디바이스를 구분할 수 있도록 hosts파일을 동기화 시킨다.
cp /etc/hosts /opt/intel/mic/filesystem/mic0/etc/hosts
cp /etc/hosts /opt/intel/mic/filesystem/mic1/etc/hosts

이제 마지막으로 작업 공간으로 공유할 공간을 각 mic에 마운트 하도록 한다.
vi /opt/intel/mic/filesystem/mic0/etc/fstab
vi /opt/intel/mic/filesystem/mic1/etc/fstab

192.168.0.1:/home /home nfs
rw,intr,soft,bg 0 0

설정이 마무리 되었다.

service MPSS start

ssh node1-mic0
ssh node1-mic1

을 이용해서 정상 동작 상태를 확인한다.

기존 소스코드를 mic노드에서 최적화하여 실행시키기 위해서는 컴파일시에 -mmic 옵션을 추가해야 한다.
퍼포먼스 체크를 위해서는 intel compiler 13.xx버전에서 제공하는 hpl을 이용하도록 한다.

서진우

슈퍼컴퓨팅 전문 기업 클루닉스/ 상무(기술이사)/ 정보시스템감리사/ 시스존 블로그 운영자

You may also like...

페이스북/트위트/구글 계정으로 댓글 가능합니다.