HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

NGC(NVIDIA GPU CLOUD)の概要

NVIDIA GPU CLOUD(以下NGC)はNVIDIAが提供しているDeep Learningおよび科学計算用に
最適化されたGPUアクセラレーションクラウドプラットフォームです。

Deep Learning環境を利用するためには課題として以下があります。
・構築の難易度が高い
 Deep Learning環境を構築するには、GPUドライバー、ライブラリ、Deep Learningのフレームワークの
 依存関係を理解した上で構築する必要があり、構築する難易度が高いです。
・一つのHW・OS環境で複数のフレームワークを利用することが難しい。
 Deep Learningのフレームワークで、GPUのドライバーやライブラリのバージョンでそれぞれ違うバージョンを
 要求する場合、その環境を構築できなかったり、構築するための難易度が非常に高くなります。
・フレームワークの開発がとても速い
 Deep Learningのフレームワークはコミニティによって非常に速いペースで開発されています。
 最新のフレームワークを利用するためにはアップデートが日々必要になります。
・一度構築したDeep Learning環境のアップデート難度が高い
 GPUドライバー、カーネル、ライブラリ、Deep Learningのフレームワークの複雑な関係性を理解して、
 アップデートする必要があります。
 例えば、依存関係を無視して、カーネルのアップデートをすると依存関係が壊れ、
 GPUが動作しなくなることがあります。
 
上記の問題を解決するのがNGCです。
NGCは複雑な依存関係を持ったDeep Learningのフレームワークをコンテナにパッケージングしているため、
複雑で時間のかかる構築手順に時間をかけず、簡単に利用することができます。
またGPUの実行に最適化されているので、環境構築後のチューニングなどにリソースを割く必要がなくなります。
複数のフレームワークのコンテナを最新のバージョンから、過去の任意のバージョンまで気軽に利用することができます。
NGCは無料で登録できるため、気軽に試すことができます。
実行可能な環境は次回で詳細を記載しますが、AWS、Azure、GCPと言った主要なクラウドサービスを始め、
DGX-1をはじめとするNVIDIAのDGXシリーズやPascal世代以降のGPUを搭載していれば利用することができます。
次回はNGCのアカウント登録の仕方および、詳細な実行要件について解説します。