NVIDIA GPU 별 딥러닝 계산 성능 측정 결과 – V100(NVL) vs V100(PCIe) vs TitanV vs GTX1080Ti
아래 자료는 최근에 테스트 했던 NVIDIA GPU 별 딥러닝 연산 성능에 대한 자료입니다.
딥러닝 연산용으로 주로 알려진 GPU 들을 모아서 테스트를 해보았습니다.
간단히 정리를 하면..
- 구매 비용 : Tesla V100 (500~600만원선), TitanV (200만원대), GTX1080Ti (100만원대)
- 딥러닝 연산 성능 : Tesla V100 > TitanV > GTX1080Ti , 다만 큰 차이는 없음.
- TitanV 의 Fp64 성능이 매우 좋음, 거의 Tesla V100 과 동급 ..
- Tesla V100 NVLink 와 PCIe 의 Multi GPU 성능 차이가 그닥 없음 (아마도 무언가 최적화 방식이나 적용 Code 가 따로 있는듯..)
참고로 V100 NVLink 가 PCIe 보다 조금 성능이 우수한데, 이 부분은 NVLink 방식의 V100 이 Max Clock 이 조금 높음.
NVIDIA Tesla V100 은 주로 기업 연구소에서 사용하는 고가의 GPU 입니다.
GTX 1080Ti 는 주로 개인 연구원들이 사용하는 가성비 좋은 GPU 라고 볼수 있습니다.
TitanV 는 Tesla V100 과 GTX 1080Ti 의 중간 가격대 입니다.
성능은 가격 차이에 비해 그다지 크지는 않습니다.
다만, 올 초 NVIDIA 라이선스 정책이 GTX 그래픽 카드의 경우 전산실에 위치한 서버에 장착을
못하게 변경되어 기업에서는 비싼 Tesla V100 을 사용해야 하는 점이 많이 아쉽네요.
아~ 그리고, V100 제품의 경우 내부 연결 방식이 NVLink 와 PCIe 로 나누어지는데,
Multi GPU 환경에서 NVLink 가 매우 좋은 성능을 발휘한다고 했는데,
일반적인 BMT Code 로는 확인할 수가 없었네요.
아무튼..참고하세요.
relaxing jazz
Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
I don’t think the title of your article matches the content lol. Just kidding, mainly because I had some doubts after reading the article.