NVIDIA GPU 별 딥러닝 계산 성능 측정 결과 – P100 vs TitanX vs Quadro6000
그간 최적 딥러닝 플랫폼 환경을 개발하면서 측정했던 다양한 GPU 의 딥러닝 계산 성능을 정리해 보았습니다.
아래 자료는 1~2년전에 주로 사용했던 GPU 였던 NVIDIA Tesla P100, TitanX, Quadro6000 그리고 조금 나온지 오래된 Tesla K40 에 대한 성능 비교자료입니다.
NVIDIA GPU 제품을 분류 하면 크게 GPGPU 계산 목적의 Tesla 제품, 3D 그래픽 처리를 위한 Quadro 제품, 게임이나 멀티미디어 목적의 GTX 제품,
그리고, 가상 VM 환경에서 vGPU 로 사용할 수 있는 GRID 제품 으로 나누어집니다.
각 제품별로 집중하는 성능 부분이 다르기 때문에 목적에 맞게 구매를 해야 했습니다.
간략한 제품 성능 특징을 분류하면 아래와 같습니다.
FP 64 | FP 32 | 3D | 가격 | |
Tesla | 매우 높음 | 매우 높음 | 매우낮음 | 매우 높음 |
Titan | 중간 | 매우 높음 | 중간 | 높음 |
GTX | 매우낮음 | 매우 높음 | 중간 | 낮음 |
Quadro | 매우낮음 | 중간 | 매우 높음 | 높음 |
다만, 딥러닝의 연산 성능은 주로 FP32 성능으로 좌우 되므로 가격대로 보았을때 GTX 를 많이 활용하게 됩니다.
하지만 기업에서는 라이선스 정책때문에 Tesla 를 사용하게 되지요..
참고하시길 바랍니다.