製品名 | NVIDIA H100 for PCIe | NVIDIA H100 NVL for PCIe | NVIDIA H100 for SXM | NVIDIA H200 NVL for PCIe | NVIDIA H200 for SXM | ||
アーキテクチャ | Hopper | Hopper | Hopper | Hopper | Hopper | ||
プロセスルール | 5nm(TSMC) | 5nm(TSMC) | 5nm(TSMC) | 5nm(TSMC) | 5nm(TSMC) | ||
倍精度性能 | FP64 | 26 TFLOPS | 34 TFLOPS | 34 TFLOPS | 34 TFLOPS | 34 TFLOPS | |
Tensor Core FP64 | 51 TFLOPS | 67 TFLOPS | 67 TFLOPS | 67 TFLOPS | 67 TFLOPS | ||
単精度性能 | FP32 | 51 TFLOPS | 67 TFLOPS | 67 TFLOPS | 67 TFLOPS | 67 TFLOPS | |
Tensor Core TF32 | 378 TFLOPS | 756 TFLOPS *疎性 | 495 TFLOPS | 989 TFLOPS *疎性 | 495 TFLOPS | 989 TFLOPS *疎性 | 495 TFLOPS | 989 TFLOPS *疎性 | 495 TFLOPS | 989 TFLOPS *疎性 | ||
半精度性能 | FP16 | 102 TFLOPS | 134 TFLOPS | 134 TFLOPS | 134 TFLOPS | 134 TFLOPS | |
Tensor Core FP16 | 756 TFLOPS | 1,513 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | ||
Tensor Core FP8 | 1,513 TFLOPS | 3,026 TFLOPS *疎性 | 1,979 TFLOPS | 3,958 TFLOPS *疎性 | 1,979 TFLOPS | 3,958 TFLOPS *疎性 | 1,979 TFLOPS | 3,958 TFLOPS *疎性 | 1,979 TFLOPS | 3,958 TFLOPS *疎性 | ||
Bfloat16 | BF16 | 102 TFLOPS | 134 TFLOPS | 134 TFLOPS | 134 TFLOPS | 134 TFLOPS | |
Tensor Core BF16 | 756 TFLOPS | 1,513 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | 989 TFLOPS | 1,979 TFLOPS *疎性 | ||
整数性能 | INT32 | 24 TOPS | 31 TOPS | 31 TOPS | 31 TOPS | 31 TOPS | |
Tensor Core INT8 | 1,513 TOPS | 3,025 TOPS *疎性 | 1,979 TOPS | 3,958 TOPS *疎性 | 1,979 TOPS | 3,958 TOPS *疎性 | 1,979 TOPS | 3,958 TOPS *疎性 | 1,979 TOPS | 3,958 TOPS *疎性 | ||
GPUメモリ | 80GB HBM3 | 94GB HBM3 | 80GB HBM3 | 141GB HBM3e | 141GB HBM3e | ||
メモリ帯域 | 2.0TB/s | 3.9TB/s | 3.4TB/s | 4.8TB/s | 4.8TB/s | ||
ECC | 有効 | 有効 | 有効 | 有効 | 有効 | ||
グラフィックス バス | PCI-Express 5.0 x16 : 128GB/s | PCI-Express 5.0 x16 : 128GB/s | PCI-Express 5.0 x16 : 128GB/s | PCI-Express 5.0 x16 : 128GB/s | PCI-Express 5.0 x16 : 128GB/s | ||
マルチインスタンスGPU(MIG) | 最大7GPU | 最大7GPU | 最大7GPU | 最大7GPU | 最大7GPU | ||
最大消費電力 | 350W | 400W(注) | 700W | 600W | 700W | ||
冷却方法 | Passive | Passive | Passive | Passive | Passive | ||
NVLink | 600GB/s (2-way) | 600GB/s (2-way) | 900GB/s (8-way) | 900GB/s (4-way) | 900GB/s (8-way) | ||
API | - | - | - | - | - | ||
NVIDIA AI Enterprise | 同梱 | 同梱 | オプション | 同梱 | オプション | ||
概形寸法 | 2スロットサイズ | 2スロットサイズ | SXM | 2スロットサイズ | SXM |
モデル | NVIDIA L40S | NVIDIA L40 |
---|---|---|
アーキテクチャ | Ada Lovelace | Ada Lovelace |
CUDAコア数 | 18176コア | 18176コア |
Tensorコア数 | 568コア | 568コア |
RTコア数 | 142コア | 142コア |
FP32(単精度) 浮動小数点数演算性能 | 91.6 TFLOPS | 90.5 TFLOPS |
TF32 Tensor 浮動小数点数演算性能 | 183.2 TFLOPS | 366.4 TFLOPS ※疎性あり | 90.5 TFLOPS | 181 TFLOPS ※疎性あり |
BF16 Tensor 浮動小数点数演算性能 | 366.4 TFLOPS | 732.8 TFLOPS ※疎性あり | 181 TFLOPS | 362 TFLOPS ※疎性あり |
GPU メモリ | 48 GB GDDR6 | 48 GB GDDR6 |
メモリバス | 384 bit | 384 bit |
メモリバンド幅 | 864GB/s | 864GB/s |
ディスプレイ ポート | 4x DisplayPort 1.4* | 4x DisplayPort 1.4* |
補助電源 | PCIe 16-pin(12VHPWR) | PCIe 16-pin(12VHPWR) |
最大消費電力 | 350 W | 300 W |
グラフィックス バス | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 |
ECC機能 | あり | あり |
冷却方法 | Passive | Passive |
NVLink | 非対応 | 非対応 |
vGPU ソフトウェア サポート* | NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS) | NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS) |
外形寸法 | 2スロットサイズ | 2スロットサイズ |
*2023 年初めに予定されている仮想化ソフトウェアのサポート仕様は変更される場合があります
モデル | NVIDIA® RTX™ 6000 Ada | NVIDIA® RTX™ 5000 Ada | NVIDIA® RTX™ 4500 Ada | NVIDIA® RTX™ 4000 Ada | NVIDIA® RTX™ 4000 SFF Ada | NVIDIA® RTX™ 2000 Ada |
---|---|---|---|---|---|---|
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace |
CUDAコアプロセッサ | 18176コア | 12800コア | 7680コア | 6144コア | 6144コア | 2816コア |
NVIDIA RT コア | 142コア | 100コア | 60コア | 48コア | 48コア | 22コア |
NVIDIA Tensor コア | 568コア | 400コア | 240コア | 192コア | 192コア | 88コア |
FP32(単精度) 浮動小数点数演算性能 | 91.1 TFLOPS | 65.3 TFLOPS | 39.6 TFLOPS | 26.7 TFLOPS | 19.17 TFLOPS | 12.0 TFLOPS |
TF32 Tensor 浮動小数点数演算性能 | 182 TFLOPS | 364 TFLOPS ※疎性あり | 131 TFLOPS | 261 TFLOPS ※疎性あり | 79 TFLOPS | 159 TFLOPS ※疎性あり | 53 TFLOPS | 107 TFLOPS ※疎性あり | 38 TFLOPS | 77 TFLOPS ※疎性あり | 24 TFLOPS | 48 TFLOPS ※疎性あり |
BF16 Tensor 浮動小数点数演算性能 | 364 TFLOPS | 728 TFLOPS ※疎性あり | 261 TFLOPS | 522 TFLOPS ※疎性あり | 159 TFLOPS | 317 TFLOPS ※疎性あり | 107 TFLOPS | 214 TFLOPS ※疎性あり | 77 TFLOPS | 153 TFLOPS ※疎性あり | 48 TFLOPS | 96 TFLOPS ※疎性あり |
GPU メモリ | 48 GB GDDR6 (エラー修正コード (ECC) 付き) | 32 GB GDDR6 (エラー修正コード (ECC) 付き) | 24 GB GDDR6 (エラー修正コード (ECC) 付き) | 20 GB GDDR6 (エラー修正コード (ECC) 付き) | 20 GB GDDR6 (エラー修正コード (ECC) 付き) | 16 GB GDDR6 (エラー修正コード (ECC) 付き) |
メモリバス | 384 bit | 256 bit | 192 bit | 160 bit | 160 bit | 128 bit |
メモリバンド幅 | 960 GB/s | 576 GB/s | 432 GB/s | 360 GB/s | 280 GB/s | 224 GB/s |
ディスプレイ ポート | 4x DisplayPort 1.4a | 4x DisplayPort 1.4a | 4x DisplayPort 1.4a | 4x mini DisplayPort 1.4a | 4x mini DisplayPort 1.4a | 4x mini DisplayPort 1.4a |
最大消費電力 | 300 W | 250 W | 210 W | 130 W | 70 W | 70 W |
電源コネクタ | PCIe CEM5 16-pin 電源コネクタ x1 | PCIe CEM5 16-pin 電源コネクタ x1 | PCIe CEM5 16-pin 電源コネクタ x1 | PCIe CEM5 16-pin 電源コネクタ x1 | 不要 | 不要 |
グラフィックス バス | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 8 |
冷却方法 | Active | Active | Active | Active | Active | Active |
NVLink Bridge | 非対応 | 非対応 | 非対応 | 非対応 | 非対応 | 非対応 |
vGPU ソフトウェア サポート* | NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS) | NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS) | 非対応 | 非対応 | 非対応 | 非対応 |
外形寸法 | 2スロットサイズ | 2スロットサイズ | 2スロットサイズ | 1スロットサイズ | Low Profile 2スロットサイズ | Low Profile 2スロットサイズ |
*2023 年初めに予定されている仮想化ソフトウェアのサポート仕様は変更される場合があります
アーキテクチャ | Ampere |
---|---|
プロセスルール | 7nm(TSMC) |
倍精度性能 | FP64 : 9.7TFLOPS FP64 Tensor Core : 19.5TFLOPS |
単精度性能 | FP32 : 19.5TFLOPS Tensor Float 32(TF32) : 156TFLOPS(Structural sparsity有効時312TFLOPS) |
半精度性能 | 312TFLOPS(Structural sparsity有効時624TFLOPS) |
Bfloat16 | 312TFLOPS(Structural sparsity有効時624TFLOPS) |
整数性能 | INT8 : 624TOPS(Structural sparsity有効時1,248TOPS) INT4 :1,248TOPS(Structural sparsity有効時2,496TOPS) |
GPUメモリ | 80GB HBM2 |
メモリ帯域 | 1.935TB/s |
ECC | 有効 |
グラフィックス バス | PCI-Express 4.0 x16 : 64GB/s |
マルチインスタンスGPU(MIG) | 最大7GPU |
最大消費電力 | 300W |
実アプリ性能 | 90% |
冷却方法 | Passive |
API | CUDA、DirectCompute、OpenCL、OpenACC |
概形寸法 | 2スロットサイズ |
モデル | NVIDIA® RTX™ A6000 | NVIDIA® RTX™ A5500 | NVIDIA® RTX™ A4500 | NVIDIA® RTX™ A2000 12GB | NVIDIA® RTX™ A1000 | NVIDIA® RTX™ A400 |
---|---|---|---|---|---|---|
アーキテクチャ | Ampere | Ampere | Ampere | Ampere | Ampere | Ampere |
CUDAコアプロセッサ | 10752コア | 10240コア | 7168コア | 3328コア | 2304コア | 768コア |
NVIDIA RT コア | 84コア | 80コア | 56コア | 26コア | 18コア | 6コア |
NVIDIA Tensor コア | 336コア | 320コア | 224コア | 104コア | 72コア | 24コア |
FP32(単精度)浮動小数点数演算性能 | 38.7 TFLOPS | 34.7 TFLOPS | 23.7 TFLOPS | 7.99 TFLOPS | 6.7 TFLOPS | 2.7 TFLOPS |
TF32 Tensor 浮動小数点数演算性能 | 77.4 TFLOPS | 155 TFLOPS ※疎性あり | 69.4 TFLOPS | 139 TFLOPS ※疎性あり | 47.3 TFLOPS | 94.6 TFLOPS ※疎性あり | 16.0 TFLOPS | 31.9 TFLOPS ※疎性あり | 13.5 TFLOPS | 27 TFLOPS ※疎性あり | 5.4 TFLOPS | 11 TFLOPS ※疎性あり |
BF16 Tensor 浮動小数点数演算性能 | 155 TFLOPS | 310 TFLOPS ※疎性あり | 139 TFLOPS | 278 TFLOPS ※疎性あり | 94.6 TFLOPS | 189 TFLOPS ※疎性あり | 31.9 TFLOPS | 63.9 TFLOPS ※疎性あり | 27 TFLOPS | 54 TFLOPS ※疎性あり | 11 TFLOPS | 22 TFLOPS ※疎性あり |
GPU メモリ | 48 GB GDDR6 (エラー修正コード (ECC) 付き) | 24 GB GDDR6 (エラー修正コード (ECC) 付き) | 20 GB GDDR6 (エラー修正コード (ECC) 付き) | 12 GB GDDR6 (エラー修正コード (ECC) 付き) | 8 GB GDDR6 | 4 GB GDDR6 |
メモリバス | 384 bit | 384 bit | 320 bit | 192 bit | 128 bit | 64 bit |
メモリバンド幅 | 786 GB/s | 768 GB/s | 640 GB/s | 288 GB/s | 192 GB/s | 96 GB/s |
ディスプレイ ポート | 4x DisplayPort 1.4a | 4x DisplayPort 1.4a | 4x DisplayPort 1.4a | 4x Mini DisplayPort 1.4a | 4x Mini DisplayPort 1.4a | 4x Mini DisplayPort 1.4a |
最大消費電力 | 300 W | 230 W | 200 W | 70 W | 50 W | 50 W |
電源コネクタ | CPU 8pin 電源コネクタ x1 | PCI Express 8pin 電源コネクタ x1 | PCI Express 8pin 電源コネクタ x1 | 不要 | 不要 | 不要 |
グラフィックス バス | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 16 | PCI Express Gen 4 x 8 | PCI Express Gen 4 x 8 |
冷却方法 | Active | Active | Active | Active | Active | Active |
NVLink Bridge | 1個 | 1個 | 1個 | - | - | - |
外形寸法 | 266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ) 2スロットサイズ | 266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ) 2スロットサイズ | 266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ) 2スロットサイズ | 169.55mm(幅)× 68.9mm(高さ)× 32.37mm(厚さ) 2スロットサイズ | Low Profile 1スロットサイズ | Low Profile 1スロットサイズ |
アーキテクチャ | Ampere |
---|---|
CUDAコア数 | 9216 |
Tensorコア数 | 288 |
RTコア数 | 72 RT コア |
FP32 | 31.2 teraFLOPS |
TF32 Tensor コア | 62.5 teraFLOPS | 125 teraFLOPS ※疎性あり |
BFLOAT16 Tensor コア | 125 teraFLOPS | 250 teraFLOPS ※疎性あり |
FP16 Tensor コア | 125 teraFLOPS | 250 teraFLOPS ※疎性あり |
INT8 Tensor コア | 250 TOPS | 500 TOPS ※疎性あり |
INT4 Tensor コア | 500 TOPS | 1,000 TOPS ※疎性あり |
GPU メモリ | 24 GB GDDR6 |
メモリバンド幅 | 600GB/s |
最大消費電力 | 150 W |
グラフィックス バス | PCI Express Gen 4 x 16 |
ECC機能 | あり |
冷却方法 | Passive |
vGPU ソフトウェア対応 | NVIDIA 仮想 PC、NVIDIA 仮想アプリケーション、NVIDIA RTX 仮想ワークステーション、NVIDIA 仮想コンピューティング サーバー |
外形寸法 | 268.60mm(幅)× 111.15mm(高さ)× 18mm(厚さ) 1スロットサイズ |
アーキテクチャ | Ampere |
---|---|
CUDAコア数 | 10752コア |
Tensorコア数 | 336コア |
RTコア数 | 84コア |
FP32 | 37.4 teraFLOPS |
TF32 Tensor コア | 74.8 teraFLOPS | 150 teraFLOPS ※疎性あり |
BFLOAT16 Tensor コア | 150 teraFLOPS | 299 teraFLOPS ※疎性あり |
FP16 Tensor コア | 150 teraFLOPS | 299 teraFLOPS ※疎性あり |
INT8 Tensor コア | 299 TOPS | 599 TOPS ※疎性あり |
INT4 Tensor コア | 599 TOPS | 1,197 TOPS ※疎性あり |
GPU メモリ | 48 GB GDDR6 |
メモリバス | 384 bit |
メモリバンド幅 | 696GB/s |
ディスプレイ ポート | 4x DisplayPort 1.4* |
最大消費電力 | 300 W |
グラフィックス バス | PCI Express Gen 4 x 16 |
ECC機能 | あり |
冷却方法 | Passive |
NVLink | NVIDIA NVLink Bridge 2-way low profile(2slot) |
vGPU ソフトウェア対応 | NVIDIA GRID®、NVIDIA Quadro® 仮想データ センター ワークステーション、NVIDIA 仮想コンピュート サーバー |
サポートされている vGPU プロファイル | 1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB |
外形寸法 | 266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ) 2スロットサイズ |
製品名 | Tesla T4 |
---|---|
CUDAコアプロセッサ数 | 2560 コア |
Tensorコア数 | 320 コア |
FP32 | 8.1 TFLOPS |
混合精度 (FP16/FP32) | 65 FP16 TFLOPS |
INT8 精度 | 130 INT8 TOPS |
INT4 精度 | 260 INT4 TOPS |
単精度浮動小数点性能 | 8.1 TFLOPS |
メモリ | 16 GB GDDR6 |
帯域幅 | 320+ GB/秒 |
最大消費電力 | 70 W |
(*1) オンボードグラフィックスとの共存ができない場合もございますのでNVIDIA Quadro®との組み合わせでのご利用を推奨致します。
製品名 | NVIDIA V100 | NVIDIA V100S |
---|---|---|
GPU アーキテクチャ | GV100 (Volta) | |
製造プロセス | 12nm | |
NVIDIA Tensor コア | 640 | |
NVIDIA CUDA コア | 5120 | |
コアクロック (GPU Boost時) | ~1370MHz | - |
Tensor演算性能 | 112TFLOPS | 130TFLOPS |
半精度浮動小数点演算性能 [FP16] | 28TFLOPS | - |
単精度浮動小数点演算性能 [FP32] | 14TFLOPS | 16.4TFLOPS |
倍精度浮動小数点演算性能 [FP64] | 7TFLOPS | 8.2TFLOPS |
メモリ容量 | 32GB HBM2 | 32GB HBM2 |
メモリインターフェイス | 4096-bit HBM2 | - |
メモリ帯域幅 | 900GB/s | 1134GB/s |
L2キャッシュ | 6MB | - |
L1キャッシュ | 10MB | - |
最大消費電力 | 250W |
※会社名及び製品名等は、当社及び各社の商標または登録商標です。価格、写真、仕様等は予告なく変更する場合があります。製品の色調及び仕様は実際と異なる場合があります。
平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)