ホーム » HPCソリューション » NVIDIA DGX-1™ ディープラーニングシステム

NVIDIA DGX-1™ ディープラーニングシステム

NVIDIA DGX-1™ は、世界で初めてディープラーニングを想定して設計されたシステムです。ハードウェアとソフトウェアが完全に統合され、迅速かつ容易に導入することができます。トレーニング時間を大幅に短縮する画期的な性能を携えて、単一筐体に収まる世界初のディープラーニング用スーパーコンピューターが誕生しました。

NVIDIA® Tesla® V100 8基搭載

DGX-1は新世代 Volta アーキテクチャ「GV100」採用のGPU NVIDIA® Tesla® V100を8基搭載し、DeepLearningとHPCの計算能力を飛躍的に向上させました。12nm FinFETプロセス技術「12nm FFN」を用いて製造されるGV100は、CUDAコア数が5120基に増加、NVLink帯域幅は300GB/s(双方向)に向上しました。 演算性能はFP32 (32ビット単精度浮動小数点演算性能)で15TFLOPS、FP64(64ビット倍精度浮動小数点演算性能)で7.5TFLOPSという怒涛のパフォーマンスを発揮します。

Tensorコアを搭載したVoltaアーキテクチャ



Tesla® V100搭載 NVIDIA® DGX-1


Volta 概要図

NVLink解説 VOLTA SM解説 シェアードメモリ
シェアードメモリとの性能差 Tensorコア解説 マルチプロセスサービス

Software Stack



NVIDIA DGX-1™ の特長

無数の機会に無限の計算を
P100.png

NVIDIA DGX-1™ は、画期的なNVIDIA Pascal™ 搭載のTesla® P100 アクセラレータで構築され、NVIDIA NVLink™ による相互接続を実装した最初のシステムです。
Pascal は、無数の計算需要に満ちた世界を認識し、理解し、シミュレートするコンピュータエンジンとして開発されました。


Supercharge Deep Learning Performance
DGX-1_SoftwareStack.png

NVIDIA DGX-1™ のソフトウェアスタックには、ディープニューラルネットワーク (DNN) の迅速な設計を目的として、主要なディープラーニングフレームワーク、NVIDIA ディープラーニング SDK、DIGITS™ トレーニングシステム、ドライバ及びCUDA® が含まれています。この強力なシステムからクラウド管理サービスにアクセスし、コンテナの作成と展開、システムアップデート、アプリケーションリポジトリを実行させることができます。Pascal ベースのTesla GPUでこれらのソフトウェア機能を連動させると、アプリケーション実行速度は以前のGPUアクセラレーションによるソリューションの12倍に達します。

反復処理とイノベーションの高速化

高性能なトレーニングにより、生産性が向上し、洞察を得るまでの時間と市場投入までの時間が短縮されます。

迅速でシンプルなデプロイ

完成品で引き渡されるNVIDIA DGX-1™ システムはプラグアンドプレイ設定機能を備え、電源投入から数分でディープラーニングを開始することができます。

投資を最大化

NVIDIA DGX-1™ サポートは、お客様の生産性を向上させ、システムのダウンタイムを削減します。ハードウェアとソフトウェアのサポートでは、NVIDIAのディープラーニングに関する専門知識のアクセスに加え、クラウド管理サービス、ソフトウェアのアップデートと更新、重大な問題の優先的解決を提供します。

競合相手の一歩先を行く

NVIDIA DGX-1™ には、ディープラーニングトレーニングの最速ソリューションを実現する画期的なテクノロジが搭載されています。



システム仕様

DGX-1 仕様
GPU 8x Tesla V100 8x Tesla P100
演算性能 [FP16] 960TFLOPS 170TFLOPS
GPU メモリ 128GB Total System
NVIDIA Tensor コア 5120 N/A
NVIDIA CUDA コア 40960 28672
CPU Dual Intel Xeon Processor E5-2698 v4 (20コア, 2.2GHz, 50MB L3Cache, 9.60GT/s QPI, 14nm, TDP135W) 
システムメモリ 512GB 2133MHz DDR4 LRDIMM
ストレージ 4x 1.92TB SSD RAID0
ネットワーク Dual 10GbE, Up to 4 InfiniBand EDR
ソフトウェア Ubuntu Linux Host OS, DGX-1 推奨GPUドライバ, CUDA Toolkit
※詳細はソフトウェアスタックをご確認ください
システム重量 134lbs / 61kg
システムサイズ (mm) D866 x W444 x H131
筐体タイプ ラックマウントタイプ (3U)
最大消費電力 3200W
電源仕様 1600W@200-240V, 10A, 50-60Hz (3+1 冗長性) ※確認中
運用温度 10-35°C ※確認中
搭載GPU 仕様
製品名 Tesla V100 Tesla P100
GPU アーキテクチャ GV100 (Volta) GP100 (Pascal)
製造プロセス 12nm 16nm
NVIDIA Tensor コア 640 N/A
NVIDIA CUDA コア 5120 3584
コアクロック (GPU Boost時) 1455MHz 1480MHz
半精度浮動小数点演算性能 [FP16] 120TFLOPS 21.2TFLOPS
単精度浮動小数点演算性能 [FP32] 15TFLOPS 10.6TFLOPS
倍精度浮動小数点演算性能 [FP64] 7.5TFLOPS 5.3TFLOPS
メモリ容量 16GB 16GB
メモリインターフェイス 4096-bit HBM2 4096-bit HBM2
メモリ帯域幅 900GB/s 720GB/s
NVLink帯域幅 (双方向) ※ 300GB/s 160GB/s
L2キャッシュ 6MB 4MB
L1キャッシュ 10MB 1.3MB
総レジスタファイル 20480KB 14336KB
最大消費電力 300W 300W

※NVIDIA® Tesla® V100 for NVLink-enabled Servers は、高速インターコネクト「NVLink」を6リンク備えています。NVLinkによるGPU間の接続帯域幅は1リンクあたり双方向50GB/s。6リンク合計で双方向300GB/sとなります。

※NVIDIA® Tesla® P100 for NVLink-enabled Servers は、高速インターコネクト「NVLink」を4リンク備えています。NVLinkによるGPU間の接続帯域幅は1リンクあたり双方向40GB/s。4リンク合計で双方向160GB/sとなります。

パフォーマンス

NVIDIA DGX-1™ は、1GPUあたり16GBメモリを内蔵するPascal™ アーキテクチャ採用の新世代GPU Tesla P100を8基搭載し、半精度浮動小数点演算性能(FP16)は最大170TFLOPSに達します。
これは、Xeon E5-2697 v3(14Core, 2.6GHz)を2基搭載したサーバーと比較して56倍の性能です。



NVIDIA DGX-1™ は、CaffeによるAlexnetの学習において目覚ましい効果を発揮しています。上述のサーバーでは、150時間かかる計算を、わずか2時間で終わらせるという驚異的な性能を誇ります。



製品カタログのダウンロード


NVIDIA Partner Network(NPN)に認定されました

HPCシステムズはNVIDIA Partner Network(NPN)に認定されました。

NPN_logo

NPNとは、NVIDIA社 の Solution Provider 向けの Program です。Solution Providerは、VAR(Value Added Reseller:付加価値再販業者)と呼ばれるパートナー企業が対象となります。

弊社は、Accelerated Computing の Preferred Solution Partner に認定されました。これによってNVIDIAの社との連携が強化され、これまで以上に質の高い製品、サービスをお客様へご提供することが可能になりました。

お問い合わせ

NVIDIA DGX-1™ のご注文・お問い合わせは以下のフォームよりお願いいたします。

お問い合わせフォーム

■ 電話・FAXでのお問い合わせ

number

【免責事項】