
高速なDNN学習計算のためのハードウェア構成ポイント
概要
深層学習にGPUが好適とよく言われていますが、比較的安価なGPUからハイエンドのものまで様々なGPUがある中で、深層学習計算の高速化にどのようなハードウェア構成が適しているのでしょうか。GPUのスペックを見ると、理論性能値に加えてGPUメモリ容量、GPUメモリ帯域幅も様々ですし、複数GPU間の高速通信を可能とするNVLinkもあります。これらの選択肢がある中で、どの指標を優先的に考慮すべきなのでしょうか。
本稿では、DNNの学習計算について、ベンチマーク結果からその答えを導いてみます。
ベンチマーク環境
本稿で用いるデータは弊社内で過去に取得したベンチマークからとなりますため、2...