linpack 이론값 구하기
슈퍼컴퓨터 시장에서는 슈퍼컴퓨터의 성능치를 나타낼수 있는 어떤 기준이 없기때문에….
초당 부동소수을 한번 계산할수 있는 단위인 Flops를 사용하고 있다.
그래서 이론적인 성능치는 Rpeak로 나타내고 실측 최대 성능치는 Rmax로 나타낸다.
여기서 Flops의 실측 성능치는 Linpack을 이용하여 테스트를 하고있다.
전세계의 슈퍼컴퓨터의 랭킹을 이 Linpack을 통하여 500위까지 순의를 1년에 두번씩 갱신하고 있다.
(6월과 11월)
주소는 http://www.top500.org 이다.
이론 성능치를 계산하는 방법은 다음과 같다.
Rpeak (Flop/s) = (cycle/s) * (Flop/cycle)*(Number of pipes)
이렇게 1개 cpu에 대한 Rpeak값을 구하고 클러스터나 슈퍼컴퓨터의 총 Rpeak값은 1개의 Rpeak값에 총 CPU수를 곱한다.
Rpeak (Total) = Rpeak(1cpu) * (Number of CPUs)
실측 최대값은 Linpack을 돌려서 나오는 값으로 한다.
이론치는 CPU 특성에 따라 다르게 계산되며,
실제 성능은 클러스터 구성에 따라 효율에 차이가 발생합니다.
클러스터 구조에서 효율을 좌우하는 가장 큰 요소는 Network 속도입니다.
Gigabit Ethernet 보다는 Myrinet 이 효율이 좋게 나타나고,
Myrinet 보다는 Infiniband 와 같은 초고속 InterConnect 장비에서 효율이 좋게 나타납니다.
이론치 성능 계산 방법
CPU Clock x CPU 개수(Core개수) x Clock 당 부동소수점 연산 회수
예1) : 3.0 GHz Dual Core 2 CPU = Total 4 core
3.0 G x 4 x 4 flops = 48 Gflops
예2) : 3.6 GHz Xeon x 4 CPU = Total 4 core
3.6 G x 4 x 2 flops = 28.8 Gflops
Intel CPU의 경우 51xx 이상 계열에서는 Clock 당 부동소수점 연산 회수가 4회입니다.
그 이전 Xeon CPU 의 경우 Clock 당 부동소수점 연산 회수는 2회입니다.
실제 성능은 HPL 프로그램을 수행한 결과이며,,
Interconnect 장비에 따라 효율이 결정됩니다.
TOP500에 올라온 자료를 살펴보면,,
Infiniband를 사용한 경우 65%~80% 정도의 효율이 나오며,,
Gigabit Ethernet 을 사용한 경우 35%~50% 정도의 효율이 나옵니다.
3 Responses
… [Trackback]
[…] Here you will find 43627 more Info to that Topic: nblog.syszone.co.kr/archives/2796 […]
… [Trackback]
[…] Read More on on that Topic: nblog.syszone.co.kr/archives/2796 […]
… [Trackback]
[…] Information on that Topic: nblog.syszone.co.kr/archives/2796 […]