Xeon E5v3 HPL 성능 관련
https://www.teratec.co.kr/xe/?document_srl=184990
벤치마크에 관한 주의점 본 벤치마크 결과는 클러스터 시스템의 일부분의 성능만을 말합니다. HPC 분야에서 필요하게 되는 능력은 이용 분야와 알고리즘이나 계산 사이즈에 의해 좌우 됩니다. 벤치마크 결과는 클러스터 시스템의 성능을 판단 하는 중요한 데이터 임에는 틀림이 없으나. 자치, 순간적인 벤치마크 성능이 장기간 지속적으로 발휘되는 것으로 생각 할 수 있습니다. 간혹 다른 타 업체에서는 순간적인 벤치마크 성능만을 고려, CPU, 메모리등에 장기간 고부하를 주었을 경우를 고려 하지 않는 경우가 더럭 있습니다.
클러스터의 성능은 안정성이 최우선 클러스터의 최종적인 성능은 단순 벤치마킹 결과에서 좌우 되는 것이 아니라 꾸준한 제품 개발 및 각 파트에 대한 확보 능력, 지원 체제, 신용도 등 종합적인 면이 바로 클러스터의 최종 성능으로 보실 수 있습니다. 단순히, 수치상의 벤치마크로는 고객으로 하여금 중복 투자를 가져 올 수도 있는 면이 있습니다. |
테스트 환경
OS: CentOS 6.5
Kernel: 2.6.32-432.el6.x86_64
Server: R1208WT
CPU: E5-2695 v3 2EA
RAM: DDR4 8G 16EA total 128G
HDD: 1TB SATA
HPL 2.1
Intel Compiler 14.0.1
Intel MPI 4.0 update3
HPL (High Performance LinPack) Test Result
HPL은 distributed-memory 컴퓨터에서 배정도 부동소수점 연산을 수행하여 그 성능을 측정 하는 소프트웨어로, HPL 패키지는 계산하는데 걸린 시간과 얻어진 해의 정확성을 분석하는 역할을 하고, 다양한 변수들을 적용하여 해장 시스템의 최상의 성능을 알아내는 역할을 한다.
테스트 결과
CPU | Core | AVX Clock | 이론 성능 | 실성능 | 효율 |
E5-2695 V3 2.3GHz | 28Core | 1.9GHz | 851.2 Gflops | 777 Gflops | 91% |
결론
본 테스트에서 사용된 E5-2695 V3 CPU는 속도가 2.3GHz 14Core 이며 AVX Clock 은 1.9GHz 이다. 이론적인 성능은 425.6Gflops 이다. 2way 로 구성이 되어 있으며, 하나의 노드의 이론적인 성능은 851.2GFlops 이다.
E5-2600 V3 이론적 성능 : {AVX Cock} X { 코어 수} X {DP FlOPS/Clock}
1.9 X 14 X 16 =425.6Gflos
E5-2600 V2 와 달리, V3 는 AVX Clock 이 있는데, 기본 Clock 과 비교 하여 있을 때 차이가 있다. 이는 전체 코어가 많아지면서, AVX, FMA 등의 기능으로 인하여 발열이 많이 발생이 되어 Clock 을 다소 낮추어 사용을 하게 되는 것이다.
테스트 시료인 E5-2695 V3 2way 의 이론 성능은 851.2Gflos 이며 실성능은 777Gflos 를 보여 주고 있어 효율은 91%을 보여 주고 있다.
기존 Intel Xeon E5-2697 V2 의 경우 Clock 은 2.7GHz이며 코어수는 12 Core 이다. 이론적인 성능은 259.2 Gflops 이다. 2Way 로 구성을 할 경우 518.4Gflops 이다.
E5-2600 V2 이론적 성능 : {CPU Clock} X {코어수} X {DP FlOPS/Clock}
2.7 X 12 X 8 = 259.2Gflops
E5-2697 V2 2way 이론 성능은 518.4Gflos 이며 실 성능은 478Gflops 를 보여 주고 있어 효율은 92%의 효율을 보여 주고 있다.
E5-2600 V3 는 기존 E5-2600 V2 와 비교시 Clock 수가 낮아도 실수 연산의 성능이 뛰어남을 볼 수 있다.
이는 V3 계열에 들어간 AVX2.0 FMA (Fused Multiply Add Instruction)의 영향을 받아서이다.
이론 성능 | 실성능 | 효율 | |
Intel Xeon E5-2697 V2 2.7GHz 12Core 2CPU | 518.4Gflops | 478Gflops | 92% |
Intel Xeon E5-2695 V3 2.3GHz 14Core 2CPU | 851.2Gflops | 777Gflops | 91% |
참고 1: E5-2600V3 Family AVX Clock
참고 2: Intel® AVX ISA Evolution