アーキテクチャ | Ampere |
---|---|
CUDAコア数 | 10752コア |
Tensorコア数 | 336コア |
RTコア数 | 84コア |
GPU メモリ | 48 GB GDDR6 |
メモリバス | 384 bit |
メモリバンド幅 | 696GB/s |
ディスプレイ ポート | 4x DisplayPort 1.4* |
最大消費電力 | 300 W |
グラフィックス バス | PCI Express Gen 4 x 16 |
ECC機能 | あり |
冷却方法 | Passive |
NVLink | NVIDIA NVLink Bridge 2-way low profile(2slot) |
vGPU ソフトウェア対応 | NVIDIA GRID®、NVIDIA Quadro® 仮想データ センター ワークステーション、NVIDIA 仮想コンピュート サーバー |
サポートされている vGPU プロファイル | 1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB |
外形寸法 | 266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)2スロットサイズ |
アーキテクチャ | Ampere |
---|---|
CUDAコアプロセッサ | 10752コア |
NVIDIA RT コア | 84コア |
NVIDIA Tensor コア | 336コア |
GPU メモリ | 48 GB GDDR6 (エラー修正コード (ECC) 付き) |
メモリバス | 384 bit |
メモリバンド幅 | 786 GB/s |
ディスプレイ ポート | 4x DisplayPort 1.4* |
最大消費電力 | 300 W |
グラフィックス バス | PCI Express Gen 4 x 16 |
フォーム ファクター | 4.4” (H) x 10.5” (L) デュアル スロット |
冷却方法 | Active |
NVLink | 2 ウェイ、ロー プロファイル (2 スロットおよび 3 スロット ブリッジ) 2 x RTX A6000 を接続 |
vGPU ソフトウェア対応 | NVIDIA GRID®、NVIDIA Quadro® 仮想データ センター ワークステーション、NVIDIA 仮想コンピュート サーバー |
サポートされている vGPU プロファイル | 1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB |
外形寸法 | 266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)2スロットサイズ |
アーキテクチャ | Ampere |
---|---|
プロセスルール | 7nm(TSMC) |
倍精度性能 | FP64 : 9.7TFLOPS FP64 Tensor Core : 19.5TFLOPS |
単精度性能 | FP32 : 19.5TFLOPS Tensor Float 32(TF32) : 156TFLOPS(Structural sparsity有効時312TFLOPS) |
半精度性能 | 312TFLOPS(Structural sparsity有効時624TFLOPS) |
Bfloat16 | 312TFLOPS(Structural sparsity有効時624TFLOPS) |
整数性能 | INT8 : 624TOPS(Structural sparsity有効時1,248TOPS) INT4 :1,248TOPS(Structural sparsity有効時2,496TOPS) |
GPUメモリ | 80GB HBM2 / 40GB HBM2 |
メモリ帯域 | 1.6TB/s |
ECC | 有効 |
インターコネクト | PCI-Express 4.0 x16 : 64GB/s |
フォームファクタ | PCI-Express 4.0 x16 : 64GB/s |
マルチインスタンスGPU(MIG) | 最大7GPU |
最大消費電力 | 250W |
実アプリ性能 | 90% |
熱処理方法 | パッシブ |
API | CUDA、DirectCompute、OpenCL、OpenACC |
製品名 | Tesla T4 |
---|---|
CUDAコアプロセッサ数 | 2560 コア |
Tensorコア数 | 320 コア |
FP32 | 8.1 TFLOPS |
混合精度 (FP16/FP32) | 65 FP16 TFLOPS |
INT8 精度 | 130 INT8 TOPS |
INT4 精度 | 260 INT4 TOPS |
単精度浮動小数点性能 | 8.1 TFLOPS |
メモリ | 16 GB GDDR6 |
帯域幅 | 320+ GB/秒 |
最大消費電力 | 70 W |
(*1) オンボードグラフィックスとの共存ができない場合もございますのでNVIDIA Quadro®との組み合わせでのご利用を推奨致します。
製品名 | NVIDIA V100 | NVIDIA V100S |
---|---|---|
GPU アーキテクチャ | GV100 (Volta) | |
製造プロセス | 12nm | |
NVIDIA Tensor コア | 640 | |
NVIDIA CUDA コア | 5120 | |
コアクロック (GPU Boost時) | ~1370MHz | - |
Tensor演算性能 | 112TFLOPS | 130TFLOPS |
半精度浮動小数点演算性能 [FP16] | 28TFLOPS | - |
単精度浮動小数点演算性能 [FP32] | 14TFLOPS | 16.4TFLOPS |
倍精度浮動小数点演算性能 [FP64] | 7TFLOPS | 8.2TFLOPS |
メモリ容量 | 32GB HBM2 | 32GB HBM2 |
メモリインターフェイス | 4096-bit HBM2 | - |
メモリ帯域幅 | 900GB/s | 1134GB/s |
L2キャッシュ | 6MB | - |
L1キャッシュ | 10MB | - |
最大消費電力 | 250W |
HPCシステムズはNVIDIA Partner Network(NPN)に認定されました。
NPNとは、NVIDIA社 の Solution Provider 向けの Program です。Solution Providerは、VAR(Value Added Reseller:付加価値再販業者)と呼ばれるパートナー企業が対象となります。
弊社は、High Performance Computing ならびに Deep Learning の ELITE Partner に認定されました。これによってNVIDIA社との連携が強化され、これまで以上に質の高い製品、サービスをお客様へご提供することが可能になりました。
平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)