NVIDIA GPU CLOUD(以下NGC)はNVIDIAが提供しているDeep Learningおよび科学計算用に
最適化されたGPUアクセラレーションクラウドプラットフォームです。
Deep Learning環境を利用するためには課題として以下があります。
・構築の難易度が高い
Deep Learning環境を構築するには、GPUドライバー、ライブラリ、Deep Learningのフレームワークの
依存関係を理解した上で構築する必要があり、構築する難易度が高いです。
・一つのHW・OS環境で複数のフレームワークを利用することが難しい。
Deep Learningのフレームワークで、GPUのドライバーやライブラリのバージョンでそれぞれ違うバージョンを
要求する場合、その環境を構築できなかったり、構築するための難易度が非常に高くなります。
・フレームワークの開発がとても速い
Deep Learningのフレームワークはコミニティによって非常に速いペースで開発されています。
最新のフレームワークを利用するためにはアップデートが日々必要になります。
・一度構築したDeep Learning環境のアップデート難度が高い
GPUドライバー、カーネル、ライブラリ、Deep Learningのフレームワークの複雑な関係性を理解して、
アップデートする必要があります。
例えば、依存関係を無視して、カーネルのアップデートをすると依存関係が壊れ、
GPUが動作しなくなることがあります。
上記の問題を解決するのがNGCです。
NGCは複雑な依存関係を持ったDeep Learningのフレームワークをコンテナにパッケージングしているため、
複雑で時間のかかる構築手順に時間をかけず、簡単に利用することができます。
またGPUの実行に最適化されているので、環境構築後のチューニングなどにリソースを割く必要がなくなります。
複数のフレームワークのコンテナを最新のバージョンから、過去の任意のバージョンまで気軽に利用することができます。
NGCは無料で登録できるため、気軽に試すことができます。
実行可能な環境は次回で詳細を記載しますが、AWS、Azure、GCPと言った主要なクラウドサービスを始め、
DGX-1をはじめとするNVIDIAのDGXシリーズやPascal世代以降のGPUを搭載していれば利用することができます。
次回はNGCのアカウント登録の仕方および、詳細な実行要件について解説します。