NVIDIA® Tensor Core GPU

AI、HPC、およびグラフィクスを高速化
Hopper / Ampere世代のGPU

NVIDIA H100 for PCIe
Hopper
80GB
PCI-Express 5.0 x16 : 128GB/s

NVIDIA A100 for PCIe
Ampere
40GB
PCI-Express 4.0 x16 : 64GB/s

NVIDIA RTX A シリーズ
Ampere
48GB GDDR6
PCI Express Gen 4 x 16

NVIDIA A10
Ampere
24GB GDDR6
PCI Express Gen 4 x 16

NVIDIA A40
Ampere
48GB GDDR6
PCI Express Gen 4 x 16

NVIDIA A100 for PCIe
Ampere
40GB HBM2
PCI-Express 4.0 x16 : 64GB/s

販売終了製品:NVIDIA T4
Turing
DDR6 16GB
PCI Express 3.0 x16

販売終了製品:NVIDIA V100 / V100s-PCIe
Volta
HBM2 32GB
PCI Express 3.0 x16

製品仕様

NVIDIA H100 for PCIe

アーキテクチャHopper
プロセスルール4nm(TSMC)
倍精度性能FP64 : 24 teraFLOPS
FP64 Tensor Core : 48 teraFLOPS
単精度性能FP32 : 48 teraFLOPS
Tensor Float 32(TF32) : 400 teraFLOPS | 800 teraFLOPS *疎性
半精度性能FP16 : 800 teraFLOPS | 1,600 teraFLOPS *疎性
FP8 : 1,600 teraFLOPS | 3,200 teraFLOPS *疎性
Bfloat16800 teraFLOPS | 1,600 teraFLOPS *疎性
整数性能INT8 : 1,600 TOPS | 3,200 TOPS *疎性
GPUメモリ80GB
メモリ帯域2TB/s
ECC有効
インターコネクトPCI-Express 5.0 x16 : 128GB/s
フォームファクタPCI-Express 5.0 x16 : 128GB/s
マルチインスタンスGPU(MIG)最大7GPU
最大消費電力350W
実アプリ性能-
熱処理方法-
API-

NVIDIA A100 for PCIe

アーキテクチャAmpere
プロセスルール7nm(TSMC)
倍精度性能FP64 : 9.7TFLOPS
FP64 Tensor Core : 19.5TFLOPS
単精度性能FP32 : 19.5TFLOPS
Tensor Float 32(TF32) : 156TFLOPS(Structural sparsity有効時312TFLOPS)
半精度性能312TFLOPS(Structural sparsity有効時624TFLOPS)
Bfloat16312TFLOPS(Structural sparsity有効時624TFLOPS)
整数性能INT8 : 624TOPS(Structural sparsity有効時1,248TOPS)
INT4 :1,248TOPS(Structural sparsity有効時2,496TOPS)
GPUメモリ80GB HBM2
メモリ帯域1.6TB/s
ECC有効
インターコネクトPCI-Express 4.0 x16 : 64GB/s
フォームファクタPCI-Express 4.0 x16 : 64GB/s
マルチインスタンスGPU(MIG)最大7GPU
最大消費電力250W
実アプリ性能90%
熱処理方法パッシブ
APICUDA、DirectCompute、OpenCL、OpenACC

NVIDIA RTX A シリーズ

モデルNVIDIA RTX
A6000
NVIDIA RTX
A5500
NVIDIA RTX
A5000
NVIDIA RTX
A4500
NVIDIA RTX
A4000
NVIDIA RTX
A2000 12GB
アーキテクチャAmpereAmpereAmpereAmpereAmpereAmpere
CUDAコアプロセッサ10752コア10240コア8192コア7168コア6144コア3228コア
NVIDIA RT コア84コア80コア64コア56コア48コア26コア
NVIDIA Tensor コア336コア 320コア256コア224コア192コア104コア
GPU メモリ48 GB GDDR6 (エラー修正コード (ECC) 付き)24 GB GDDR6 (エラー修正コード (ECC) 付き)24 GB GDDR6 (エラー修正コード (ECC) 付き)20 GB GDDR6 (エラー修正コード (ECC) 付き)16 GB GDDR6 (エラー修正コード (ECC) 付き)12 GB GDDR6 (エラー修正コード (ECC) 付き)
メモリバス384 bit384 bit384 bit320 bit256 bit192 bit
メモリバンド幅786 GB/s768 GB/s768 GB/s640 GB/s448 GB/s288 GB/s
ディスプレイ ポート4x DisplayPort 1.44x DisplayPort 1.44x DisplayPort 1.44x DisplayPort 1.44x DisplayPort 1.44x Mini DisplayPort
最大消費電力300 W230 W230 W200 W140 W70 W
グラフィックス バスPCI Express Gen 4 x 16PCI Express Gen 4 x 16PCI Express Gen 4 x 16PCI Express Gen 4 x 16PCI Express Gen 4 x 16PCI Express Gen 4 x 16
フォーム ファクター4.4” (H) x 10.5” (L) デュアル スロット4.4” (H) x 10.5” (L) デュアル スロット4.4” (H) x 10.5” (L) デュアル スロット4.4” (H) x 10.5” (L) デュアル スロット4.4” (H) x 9.5” (L) シングル スロット4.4” (H) x 10.5” (L) デュアル スロット
冷却方法ActiveActiveActiveActiveActiveActive
NVLink2 ウェイ、ロー プロファイル (2 スロットおよび 3 スロット ブリッジ) 2 x RTX A6000 を接続2 ウェイ、ロー プロファイル (2 スロットおよび 3 スロット ブリッジ) 2 x RTX A5500 を接続2 ウェイ、ロー プロファイル (2 スロットおよび 3 スロット ブリッジ) 2 x RTX A5000 を接続2 ウェイ、ロー プロファイル (2 スロット) 2 x RTX A4500 を接続--
vGPU ソフトウェア対応NVIDIA Virtual PC/Virtual Applications(vPC/vApps)、NVIDIA RTX Virtual Workstation(vWS)、
NVIDIA Virtual Compute Server (vCS)
NVIDIA Virtual PC/Virtual Applications(vPC/vApps)、NVIDIA RTX Virtual Workstation(vWS)、
NVIDIA Virtual Compute Server (vCS)
NVIDIA Virtual PC/Virtual Applications(vPC/vApps)、NVIDIA RTX Virtual Workstation(vWS)、
NVIDIA Virtual Compute Server (vCS)
N/AN/AN/A
サポートされている vGPU プロファイル1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GBN/AN/AN/A
外形寸法266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)
2スロットサイズ
266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)
2スロットサイズ
266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)
2スロットサイズ
266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)
2スロットサイズ
241.3mm(幅)× 111.15mm(高さ)× 18mm(厚さ)
1スロットサイズ
169.55mm(幅)× 68.9mm(高さ)× 32.37mm(厚さ)
2スロットサイズ

NVIDIA A10

アーキテクチャAmpere
CUDAコア数9216 ※公開情報などからの推測値です
Tensorコア数288 ※公開情報などからの推測値です
RTコア数72 RT コア
FP3231.2 teraFLOPS
TF32 Tensor コア62.5 teraFLOPS | 125 teraFLOPS ※疎性あり
BFLOAT16 Tensor コア125 teraFLOPS | 250 teraFLOPS ※疎性あり
FP16 Tensor コア125 teraFLOPS | 250 teraFLOPS ※疎性あり
INT8 Tensor コア250 TOPS | 500 TOPS ※疎性あり
INT4 Tensor コア500 TOPS | 1,000 TOPS ※疎性あり
GPU メモリ24 GB GDDR6
メモリバンド幅600GB/s
最大消費電力150 W
グラフィックス バスPCI Express Gen 4 x 16
ECC機能あり
冷却方法Passive
vGPU ソフトウェア対応NVIDIA 仮想 PC、NVIDIA 仮想アプリケーション、NVIDIA RTX 仮想ワークステーション、NVIDIA 仮想コンピューティング サーバー
外形寸法268.60mm(幅)× 111.15mm(高さ)× 18mm(厚さ)1スロットサイズ

NVIDIA A40

アーキテクチャAmpere
CUDAコア数10752コア
Tensorコア数336コア
RTコア数84コア
GPU メモリ48 GB GDDR6
メモリバス384 bit
メモリバンド幅696GB/s
ディスプレイ ポート4x DisplayPort 1.4*
最大消費電力300 W
グラフィックス バスPCI Express Gen 4 x 16
ECC機能あり
冷却方法Passive
NVLinkNVIDIA NVLink Bridge 2-way low profile(2slot)
vGPU ソフトウェア対応NVIDIA GRID®、NVIDIA Quadro® 仮想データ センター ワークステーション、NVIDIA 仮想コンピュート サーバー
サポートされている vGPU プロファイル1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB
外形寸法266.7mm(幅)× 111.15mm(高さ)× 37mm(厚さ)2スロットサイズ

販売終了製品:NVIDIA® T4

製品名 Tesla T4
CUDAコアプロセッサ数2560 コア
Tensorコア数320 コア
FP328.1 TFLOPS
混合精度 (FP16/FP32)65 FP16 TFLOPS
INT8 精度130 INT8 TOPS
INT4 精度260 INT4 TOPS
単精度浮動小数点性能8.1 TFLOPS
メモリ16 GB GDDR6
帯域幅320+ GB/秒
最大消費電力70 W

(*1) オンボードグラフィックスとの共存ができない場合もございますのでNVIDIA Quadro®との組み合わせでのご利用を推奨致します。

販売終了製品:NVIDIA V100 / V100s

製品名 NVIDIA V100NVIDIA V100S
GPU アーキテクチャGV100 (Volta)
製造プロセス12nm
NVIDIA Tensor コア640
NVIDIA CUDA コア5120
コアクロック (GPU Boost時)~1370MHz-
Tensor演算性能112TFLOPS130TFLOPS
半精度浮動小数点演算性能 [FP16]28TFLOPS-
単精度浮動小数点演算性能 [FP32]14TFLOPS16.4TFLOPS
倍精度浮動小数点演算性能 [FP64]7TFLOPS8.2TFLOPS
メモリ容量 32GB HBM232GB HBM2
メモリインターフェイス4096-bit HBM2-
メモリ帯域幅900GB/s1134GB/s
L2キャッシュ6MB-
L1キャッシュ10MB-
最大消費電力250W
  • キャンペーン情報
    現在開催されているお得なキャンペーン情報はこちらから。
    詳細
  • ご購入前のお問合せ
    フォームにご入力いただければ後ほど営業よりご連絡させていただきます。
    詳細
  • 見積り依頼
    フォームにご入力いただければ後ほど営業よりご連絡させていただきます。
    詳細
CONTACT

お問い合わせ

お客様に最適な製品をご提案いたします。まずは気軽にお問い合わせ下さい。
03-5446-5531

平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)