NVIDIA GRID M10, M60 기능, 성능 비교 분석

NVIDIA M60, M10 비교 분석

 

작성일 : 2016년 9월 1일

작성자 : 서진우 ( alang@clunix.com )

 

본 문서에서는 2016년 출시된 NVIDIA 의 새로운 GRID-M 계열의 GPU 사양, 특징, 성능에 대해

알아보고자 한다.

GRID-M 계열의 경우 크게 가상머신의 vGPU 를 할당하여 고성능 3D 그래픽 성능을 제공하는 용도와

CUDA를 이용한 GPGPU 계산 분야에 사용이 가능하다.

 

아래는 GRID-M60, M10 의 사양과 특징에 대한 비교 정보이다.

 

  • NVIDIA M-Series GPU 사양

 

 

 

 

GRID-M 은 지난 GRID-K 에 비해 CUDA Core, Memory, vGPU수와 같은 사양이 모두 2배로

확장되었다.

 

특히 H.264 인코더 streams 가 대폭 많아지면서 고해상도 스크린 환경에서 FPS 가 보다 많이

개선되어 보였다.

 

그리고 4K 모니터 해상도 지원이 가능하다.

 

  • NVIDIA GRID vGPU 라이선스별 기능 정보

 

 

 

 

라이선스는 크게 App, PC, WS 3가지 형태로 나누어진다. 차이는 해상도와 멀티모니터수 등이 있지만

가장 영향을 주는 것은 GPU 메모리 용량이다. 고성능의 3D CAD, 그래픽이 요구되는 R&D 환경에서는

메모리 한계 때문이라도 WS 라이선스가 필요하다. 즉 M60-2Q 이상의 vGPU를 사용할 경우라면 WS

라이선스가 필요하다. 만약 pGPU를 그대로 사용할 경우라도 WS 라이선스가 필요하다.

 

  • M60 vs M10 성능 비교

 

 

테스트는 Specviewperf 로 3D Graphic 처리 성능과 Unigine 3D BMT Tool 로 3D 화면 전송 FPS

성능을 측정한 결과 이다.

 

M10-PassThrough (pGPU *4) 의 경우 M60-4Q (vGPU *4)와 유사하거나 조금 떨어지는 성능을

확인했다. 하지만 M60-2Q (vGPU *8) 보다는 모든 측면에서 높은 성능이 확인 되었다.

 

 

그간 7~8년 동안 테스트해 온 역대 NVIDIA Quadro 그래픽 카드의 성능을 모두 비교한 결과이다.

(테스트한 서버의 사양이 시점마다 다르기 때문에 그래픽 성능에 영향을 줄 수는 있지만 큰 맥락에서 참고하길..)

M10의 pGPU 는 M60-4Q, K260Q, K2000 급과 유사하다고 보면 좋을 듯 하다.

(NVIDIA 포럼에서는 M2000과 유사 성능이라고 함)

 

 

  • 고성능 3D VDI Cloud 환경 구성 시,  M10 GPU 경쟁력  

 

 

애초 M10 을 검토하게된 배경은 Intel Xeon v4 출시,  Hypervisor Version Up, Nvidia GRID 2.0 Up

이 되면서 기존의 부가되지 않았던 라이선스 비용이 여러곳에서 발생하기 때문이다.

대표적인 것이  XenServer Enterprise License 와 Nvidia vGPU License 이다.

 

Citrix XenServer 의 경우 6.2 버전에서 HA 와 같은 몇 개의 부가 기능을 3d party 형태로 제외 시켜

버린 후 모든 기능을 공개 버전으로 전환했다. (당연 Subscription 형태의 라이선스는 존재함)

vGPU 의 경우 6.2 버전에서 부터 지원이 되었는데, 이때는 무료 버전에 기능이 포함되어 있었다.

하지만 6.5 버전이 나오면서 Enterprise 버전과 , Standard 버전으로 나누어지고, Standard 버전은

무료로 사용이 가능하지만, Enterprise 버전은 상용으로 전환했다. 그리고, vGPU 기능은 Enterprise

에서만 활성화 된다.

 

NVIDIA GRID 제품 역시, 1.0 에서 2.0 으로, Kepler 에서 Maxwell 로 차기 모델이 나오면서

기존의 Quadro (그래픽용)와 Tesla (GPGPU계산용) 를 하나의 Mawell 모델로 통합하는 형태가

되었다.  GRID 2.0 의 대표 모델인 M60, M10 GPU 의 경우도 같은 보드를 펌웨어 모드 변경을

통해 Graphic 용과 Compute 용으로 나누어 사용이 가능하다.

Graphic 용으로 사용할 경우 Virtual GPU 를 사용할 수 있는데, 이경우 별도의 Virtual GPU 라이선스

가  필요하다.

 

만일 M10 으로 4개의 pGPU(vGPU가 아닌) 를 사용하게 된다면, XenServer Enterprise License 와

Nvidia vGPU License 비용이 절약될거라 예상했었다.

 

또한 M시리즈로 변경되면서 vGPU의 듀얼모니터 인식과 해상도 조절에 대한 기능 구조가 변경되어

몇몇 솔루션의 경우 이를 조정해야 하는 부담도 존재한다. 만일 pGPU를 사용할 경우 NVIDIA Quadro

계열 GPU 에 제공하는 시스템 토플리지 기능을 통해 부가적인 EDID 삽입으로 듀얼 모니터  이용에

필요한 환경을 쉽게 구현할 수 있을거라 예상했다.

 

하지만, 결과는 참담하였다.

 

M 시리즈부터 GRID GPU 의 pGPU를 사용하더라도 Graphic 용으로 사용하기 위해서는 최고 비싼

Virtual WS 라이선스가 필요하다. 해당 라이선스가 없을 경우에는 GPGPU 계산용으로만 사용이

가능하다.

 

그리고, pGPU 의 경우 시스템 토플리지 기능은 제공하지만, K 시리즈에서 인식하던 부가적인

Display port 가 더 이상 제공되지 않는다. 오직 현재 인식된 Display 인 NVIDIA VGX 만 인식된다.

즉, 듀얼 모니터 인식을 위한 수정도 결국 해야한다는 결론이다.

 

남은것은 XenServer Enterprise 라이선스이다. 이 부분은 vGPU 를 사용하지 않기 때문에

XenServer Standard 버전으로 서비스가 가능하다. (Free 버전으로 구성 가능)

 

  • M60, M10 GPGPU 성능 검토

GRID-M 제품이 vGPU 용도와 GPGPU 계산용도의 제품을 하나로 통합한 의미가 있다면, M60과 M10의 

CUDA 계산 성능은 어느 정도 인지 확인해 필요가 있을 하다.

아래는 GPGPU 용도로 잘 알려진 Tesla-K40 과 실제 성능을 비교한 결과이다.

성능 측정에 사용된 툴은 Cuda SDK sample 포함되어 있는 nobody single precision double precision

계산 flops 확인하였다.

, HPC 공식 성능 측정 도구인 HPL 의 Cuda 버전을 이용하여 flops 측정해 보았다.

Single precision 계산에서는 GRID 계열의 M60, M10 성능이 기존의 Tesla 제품 보다 우수한 성능을

나타내는 것을 확인하였다.

다만, double precision 계산의 경우, Tesla K40 매우 미치는 성능을 나타내는 것을 확인하였다.

GPGPU 계산 분야에서도 여러 장의 GPU 동일 서버에 탑재하여 Multi GPU 계산 능력을 확보하고픈

요구가 많기 때문에 1개의 Board 에 여러 개의 GPU 포함된 GRID 계열이 의미가 있어 보인다.

하지만, 실제 응용에서 요구하는 계산 형태에 따라 기존의 Tesla 계열의 제품을 선택할지, GRID 계열의

제품을 선택할지를 신중히 결정할 필요가 있어보인다.

서진우

슈퍼컴퓨팅 전문 기업 클루닉스/ 상무(기술이사)/ 정보시스템감리사/ 시스존 블로그 운영자

You may also like...

페이스북/트위트/구글 계정으로 댓글 가능합니다.