HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

DNN

DL

高速なDNN学習計算のためのハードウェア構成ポイント

概要 深層学習にGPUが好適とよく言われていますが、比較的安価なGPUからハイエンドのものまで様々なGPUがある中で、深層学習計算の高速化にどのようなハードウェア構成が適しているのでしょうか。GPUのスペックを見ると、理論性能値に加えてGPUメモリ容量、GPUメモリ帯域幅も様々ですし、複数GPU間の高速通信を可能とするNVLinkもあります。これらの選択肢がある中で、どの指標を優先的に考慮すべきなのでしょうか。 本稿では、DNNの学習計算について、ベンチマーク結果からその答えを導いてみます。 ベンチマーク環境 本稿で用いるデータは弊社内で過去に取得したベンチマークからとなりますため、2...