NVIDIA® GPU

ホーム > HPC・DL・AI > HPC製品＆サービス > ハードウェア > 周辺機器 > NVIDIA® GPU

AI、HPC、およびグラフィクスを高速化
Blackwell/Hopper/Ada Loverance/Ampere世代のGPU世代のGPU等

NVIDIA H100 for PCIe: Hopper

80GB

PCI-Express 5.0 x16 : 128GB/s; 製品仕様はこちら

NVIDIA L40: Ada Lovelace

48GB GDDR6

PCI Express Gen 4 x 16; 製品仕様はこちら

NVIDIA RTX 6000 Ada: Ada Lovelace

48GB GDDR6

PCI Express Gen 4 x 16; 製品仕様はこちら

NVIDIA A100 for PCIe: Ampere

40GB

PCI-Express 4.0 x16 : 64GB/s; 製品仕様はこちら

NVIDIA RTX A シリーズ: Ada Lovelace / Ampere

48GB GDDR6

PCI Express Gen 4 x 16; 製品仕様はこちら

NVIDIA A10: Ampere

24GB GDDR6

PCI Express Gen 4 x 16; 製品仕様はこちら

NVIDIA A40: Ampere

48GB GDDR6

PCI Express Gen 4 x 16; 製品仕様はこちら

販売終了製品：NVIDIA T4: Turing

DDR6 16GB

PCI Express 3.0 x16; 製品仕様はこちら

販売終了製品：NVIDIA V100 / V100s-PCIe: Volta

HBM2 32GB

PCI Express 3.0 x16; 製品仕様はこちら

製品仕様

NVIDIA H100 for PCIe

製品名		NVIDIA H100 for PCIe	NVIDIA H100 NVL for PCIe	NVIDIA H100 for SXM	NVIDIA H200 NVL for PCIe	NVIDIA H200 for SXM
アーキテクチャ		Hopper	Hopper	Hopper	Hopper	Hopper
プロセスルール		5nm(TSMC)	5nm(TSMC)	5nm(TSMC)	5nm(TSMC)	5nm(TSMC)
倍精度性能	FP64	26 TFLOPS	30 TFLOPS	34 TFLOPS	34 TFLOPS	34 TFLOPS
倍精度性能	Tensor Core FP64	51 TFLOPS	60 TFLOPS	67 TFLOPS	67 TFLOPS	67 TFLOPS
単精度性能	FP32	51 TFLOPS	60 TFLOPS	67 TFLOPS	67 TFLOPS	67 TFLOPS
単精度性能	Tensor Core TF32	378 TFLOPS \| 756 TFLOPS *疎性	418 TFLOPS \| 835 TFLOPS *疎性	495 TFLOPS \| 989 TFLOPS *疎性	495 TFLOPS \| 989 TFLOPS *疎性	495 TFLOPS \| 989 TFLOPS *疎性
半精度性能	FP16	102 TFLOPS	121 TFLOPS	134 TFLOPS	134 TFLOPS	134 TFLOPS
	Tensor Core FP16	756 TFLOPS \| 1,513 TFLOPS *疎性	835 TFLOPS \| 1,670 TFLOPS *疎性	989 TFLOPS \| 1,979 TFLOPS *疎性	989 TFLOPS \| 1,979 TFLOPS *疎性	989 TFLOPS \| 1,979 TFLOPS *疎性
	Tensor Core FP8	1,513 TFLOPS \| 3,026 TFLOPS *疎性	1,670 TFLOPS \| 3,341 TFLOPS *疎性	1,979 TFLOPS \| 3,958 TFLOPS *疎性	1,979 TFLOPS \| 3,958 TFLOPS *疎性	1,979 TFLOPS \| 3,958 TFLOPS *疎性
Bfloat16	BF16	102 TFLOPS	121 TFLOPS	134 TFLOPS	134 TFLOPS	134 TFLOPS
Bfloat16	Tensor Core BF16	756 TFLOPS \| 1,513 TFLOPS *疎性	835 TFLOPS \| 1,670 TFLOPS *疎性	989 TFLOPS \| 1,979 TFLOPS *疎性	989 TFLOPS \| 1,979 TFLOPS *疎性	989 TFLOPS \| 1,979 TFLOPS *疎性
整数性能	INT32	26 TOPS	30 TOPS	34 TOPS	34 TOPS	34 TOPS
整数性能	Tensor Core INT8	1,513 TOPS \| 3,025 TOPS *疎性	1,670 TOPS \| 3,341 TOPS *疎性	1,979 TOPS \| 3,958 TOPS *疎性	1,979 TOPS \| 3,958 TOPS *疎性	1,979 TOPS \| 3,958 TOPS *疎性
GPUメモリ		80GB HBM2e	94GB HBM3	80GB HBM3	141GB HBM3e	141GB HBM3e
メモリ帯域		2.0TB/s	3.9TB/s	3.4TB/s	4.8TB/s	4.8TB/s
ECC		有効	有効	有効	有効	有効
グラフィックスバス		PCI-Express 5.0 x16 : 128GB/s	PCI-Express 5.0 x16 : 128GB/s	PCI-Express 5.0 x16 : 128GB/s	PCI-Express 5.0 x16 : 128GB/s	PCI-Express 5.0 x16 : 128GB/s
マルチインスタンスGPU(MIG)		最大7GPU	最大7GPU	最大7GPU	最大7GPU	最大7GPU
最大消費電力		350W	400W(注)	700W	600W	700W
冷却方法		Passive	Passive	Passive	Passive	Passive
NVLink		600GB/s (2-way)	600GB/s (2-way)	900GB/s (8-way)	900GB/s (4-way)	900GB/s (8-way)
API		-	-	-	-	-
NVIDIA AI Enterprise		同梱	同梱	オプション	同梱	オプション
概形寸法		2スロットサイズ	2スロットサイズ	SXM	2スロットサイズ	SXM

NVIDIA L40

モデル	NVIDIA L40S	NVIDIA L40
アーキテクチャ	Ada Lovelace	Ada Lovelace
CUDAコア数	18176コア	18176コア
Tensorコア数	568コア	568コア
RTコア数	142コア	142コア
FP32(単精度) 浮動小数点数演算性能	91.6 TFLOPS	90.5 TFLOPS
TF32 Tensor 浮動小数点数演算性能	183.2 TFLOPS \| 366.4 TFLOPS ※疎性あり	90.5 TFLOPS \| 181 TFLOPS ※疎性あり
BF16 Tensor 浮動小数点数演算性能	366.4 TFLOPS \| 732.8 TFLOPS ※疎性あり	181 TFLOPS \| 362 TFLOPS ※疎性あり
GPU メモリ	48 GB GDDR6	48 GB GDDR6
メモリバス	384 bit	384 bit
メモリバンド幅	864GB/s	864GB/s
ディスプレイポート	4x DisplayPort 1.4*	4x DisplayPort 1.4*
補助電源	PCIe 16-pin(12VHPWR)	PCIe 16-pin(12VHPWR)
最大消費電力	350 W	300 W
グラフィックスバス	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16
ECC機能	あり	あり
冷却方法	Passive	Passive
NVLink	非対応	非対応
vGPU ソフトウェアサポート*	NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS)	NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS)
外形寸法	2スロットサイズ	2スロットサイズ

*2023 年初めに予定されている仮想化ソフトウェアのサポート仕様は変更される場合があります

NVIDIA RTX 6000 Ada

モデル	NVIDIA® RTX™ 6000 Ada	NVIDIA® RTX™ 5000 Ada	NVIDIA® RTX™ 4500 Ada	NVIDIA® RTX™ 4000 Ada	NVIDIA® RTX™ 4000 SFF Ada	NVIDIA® RTX™ 2000 Ada
アーキテクチャ	Ada Lovelace	Ada Lovelace	Ada Lovelace	Ada Lovelace	Ada Lovelace	Ada Lovelace
CUDAコアプロセッサ	18176コア	12800コア	7680コア	6144コア	6144コア	2816コア
NVIDIA RT コア	142コア	100コア	60コア	48コア	48コア	22コア
NVIDIA Tensor コア	568コア	400コア	240コア	192コア	192コア	88コア
FP32(単精度) 浮動小数点数演算性能	91.1 TFLOPS	65.3 TFLOPS	39.6 TFLOPS	26.7 TFLOPS	19.17 TFLOPS	12.0 TFLOPS
TF32 Tensor 浮動小数点数演算性能	182 TFLOPS \| 364 TFLOPS ※疎性あり	131 TFLOPS \| 261 TFLOPS ※疎性あり	79 TFLOPS \| 159 TFLOPS ※疎性あり	53 TFLOPS \| 107 TFLOPS ※疎性あり	38 TFLOPS \| 77 TFLOPS ※疎性あり	24 TFLOPS \| 48 TFLOPS ※疎性あり
BF16 Tensor 浮動小数点数演算性能	364 TFLOPS \| 728 TFLOPS ※疎性あり	261 TFLOPS \| 522 TFLOPS ※疎性あり	159 TFLOPS \| 317 TFLOPS ※疎性あり	107 TFLOPS \| 214 TFLOPS ※疎性あり	77 TFLOPS \| 153 TFLOPS ※疎性あり	48 TFLOPS \| 96 TFLOPS ※疎性あり
GPU メモリ	48 GB GDDR6 (エラー修正コード (ECC) 付き)	32 GB GDDR6 (エラー修正コード (ECC) 付き)	24 GB GDDR6 (エラー修正コード (ECC) 付き)	20 GB GDDR6 (エラー修正コード (ECC) 付き)	20 GB GDDR6 (エラー修正コード (ECC) 付き)	16 GB GDDR6 (エラー修正コード (ECC) 付き)
メモリバス	384 bit	256 bit	192 bit	160 bit	160 bit	128 bit
メモリバンド幅	960 GB/s	576 GB/s	432 GB/s	360 GB/s	280 GB/s	224 GB/s
ディスプレイポート	4x DisplayPort 1.4a	4x DisplayPort 1.4a	4x DisplayPort 1.4a	4x mini DisplayPort 1.4a	4x mini DisplayPort 1.4a	4x mini DisplayPort 1.4a
最大消費電力	300 W	250 W	210 W	130 W	70 W	70 W
電源コネクタ	PCIe CEM5 16-pin 電源コネクタ x1	PCIe CEM5 16-pin 電源コネクタ x1	PCIe CEM5 16-pin 電源コネクタ x1	PCIe CEM5 16-pin 電源コネクタ x1	不要	不要
グラフィックスバス	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 8
冷却方法	Active	Active	Active	Active	Active	Active
NVLink Bridge	非対応	非対応	非対応	非対応	非対応	非対応
vGPU ソフトウェアサポート*	NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS)	NVIDIA vPC/vApp、NVIDIA RTX 仮想ワークステーション (vWS)	非対応	非対応	非対応	非対応
外形寸法	2スロットサイズ	2スロットサイズ	2スロットサイズ	1スロットサイズ	Low Profile 2スロットサイズ	Low Profile 2スロットサイズ

*2023 年初めに予定されている仮想化ソフトウェアのサポート仕様は変更される場合があります

NVIDIA A100 for PCIe

アーキテクチャ	Ampere
プロセスルール	7nm(TSMC)
倍精度性能	FP64 : 9.7TFLOPS FP64 Tensor Core : 19.5TFLOPS
単精度性能	FP32 : 19.5TFLOPS Tensor Float 32(TF32) : 156TFLOPS(Structural sparsity有効時312TFLOPS)
半精度性能	312TFLOPS(Structural sparsity有効時624TFLOPS)
Bfloat16	312TFLOPS(Structural sparsity有効時624TFLOPS)
整数性能	INT8 : 624TOPS(Structural sparsity有効時1,248TOPS) INT4 :1,248TOPS(Structural sparsity有効時2,496TOPS)
GPUメモリ	80GB HBM2
メモリ帯域	1.935TB/s
ECC	有効
グラフィックスバス	PCI-Express 4.0 x16 : 64GB/s
マルチインスタンスGPU(MIG)	最大7GPU
最大消費電力	300W
実アプリ性能	90%
冷却方法	Passive
API	CUDA、DirectCompute、OpenCL、OpenACC
概形寸法	2スロットサイズ

NVIDIA RTX A シリーズ

モデル	NVIDIA® RTX™ A6000	NVIDIA® RTX™ A5500	NVIDIA® RTX™ A4500	NVIDIA® RTX™ A2000 12GB	NVIDIA® RTX™ A1000	NVIDIA® RTX™ A400
アーキテクチャ	Ampere	Ampere	Ampere	Ampere	Ampere	Ampere
CUDAコアプロセッサ	10752コア	10240コア	7168コア	3328コア	2304コア	768コア
NVIDIA RT コア	84コア	80コア	56コア	26コア	18コア	6コア
NVIDIA Tensor コア	336コア	320コア	224コア	104コア	72コア	24コア
FP32(単精度)浮動小数点数演算性能	38.7 TFLOPS	34.7 TFLOPS	23.7 TFLOPS	7.99 TFLOPS	6.7 TFLOPS	2.7 TFLOPS
TF32 Tensor 浮動小数点数演算性能	77.4 TFLOPS \| 155 TFLOPS ※疎性あり	69.4 TFLOPS \| 139 TFLOPS ※疎性あり	47.3 TFLOPS \| 94.6 TFLOPS ※疎性あり	16.0 TFLOPS \| 31.9 TFLOPS ※疎性あり	13.5 TFLOPS \| 27 TFLOPS ※疎性あり	5.4 TFLOPS \| 11 TFLOPS ※疎性あり
BF16 Tensor 浮動小数点数演算性能	155 TFLOPS \| 310 TFLOPS ※疎性あり	139 TFLOPS \| 278 TFLOPS ※疎性あり	94.6 TFLOPS \| 189 TFLOPS ※疎性あり	31.9 TFLOPS \| 63.9 TFLOPS ※疎性あり	27 TFLOPS \| 54 TFLOPS ※疎性あり	11 TFLOPS \| 22 TFLOPS ※疎性あり
GPU メモリ	48 GB GDDR6 (エラー修正コード (ECC) 付き)	24 GB GDDR6 (エラー修正コード (ECC) 付き)	20 GB GDDR6 (エラー修正コード (ECC) 付き)	12 GB GDDR6 (エラー修正コード (ECC) 付き)	8 GB GDDR6	4 GB GDDR6
メモリバス	384 bit	384 bit	320 bit	192 bit	128 bit	64 bit
メモリバンド幅	786 GB/s	768 GB/s	640 GB/s	288 GB/s	192 GB/s	96 GB/s
ディスプレイポート	4x DisplayPort 1.4a	4x DisplayPort 1.4a	4x DisplayPort 1.4a	4x Mini DisplayPort 1.4a	4x Mini DisplayPort 1.4a	4x Mini DisplayPort 1.4a
最大消費電力	300 W	230 W	200 W	70 W	50 W	50 W
電源コネクタ	CPU 8pin 電源コネクタ x1	PCI Express 8pin 電源コネクタ x1	PCI Express 8pin 電源コネクタ x1	不要	不要	不要
グラフィックスバス	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 16	PCI Express Gen 4 x 8	PCI Express Gen 4 x 8
冷却方法	Active	Active	Active	Active	Active	Active
NVLink Bridge	1個	1個	1個	-	-	-
外形寸法	266.7mm（幅）× 111.15mm（高さ）× 37mm（厚さ） 2スロットサイズ	266.7mm（幅）× 111.15mm（高さ）× 37mm（厚さ） 2スロットサイズ	266.7mm（幅）× 111.15mm（高さ）× 37mm（厚さ） 2スロットサイズ	169.55mm（幅）× 68.9mm（高さ）× 32.37mm（厚さ） 2スロットサイズ	Low Profile 1スロットサイズ	Low Profile 1スロットサイズ

NVIDIA A10

アーキテクチャ	Ampere
CUDAコア数	9216
Tensorコア数	288
RTコア数	72 RT コア
FP32	31.2 teraFLOPS
TF32 Tensor コア	62.5 teraFLOPS \| 125 teraFLOPS ※疎性あり
BFLOAT16 Tensor コア	125 teraFLOPS \| 250 teraFLOPS ※疎性あり
FP16 Tensor コア	125 teraFLOPS \| 250 teraFLOPS ※疎性あり
INT8 Tensor コア	250 TOPS \| 500 TOPS ※疎性あり
INT4 Tensor コア	500 TOPS \| 1,000 TOPS ※疎性あり
GPU メモリ	24 GB GDDR6
メモリバンド幅	600GB/s
最大消費電力	150 W
グラフィックスバス	PCI Express Gen 4 x 16
ECC機能	あり
冷却方法	Passive
vGPU ソフトウェア対応	NVIDIA 仮想 PC、NVIDIA 仮想アプリケーション、NVIDIA RTX 仮想ワークステーション、NVIDIA 仮想コンピューティングサーバー
外形寸法	268.60mm（幅）× 111.15mm（高さ）× 18mm（厚さ） 1スロットサイズ

NVIDIA A40

アーキテクチャ	Ampere
CUDAコア数	10752コア
Tensorコア数	336コア
RTコア数	84コア
FP32	37.4 teraFLOPS
TF32 Tensor コア	74.8 teraFLOPS \| 150 teraFLOPS ※疎性あり
BFLOAT16 Tensor コア	150 teraFLOPS \| 299 teraFLOPS ※疎性あり
FP16 Tensor コア	150 teraFLOPS \| 299 teraFLOPS ※疎性あり
INT8 Tensor コア	299 TOPS \| 599 TOPS ※疎性あり
INT4 Tensor コア	599 TOPS \| 1,197 TOPS ※疎性あり
GPU メモリ	48 GB GDDR6
メモリバス	384 bit
メモリバンド幅	696GB/s
ディスプレイポート	4x DisplayPort 1.4*
最大消費電力	300 W
グラフィックスバス	PCI Express Gen 4 x 16
ECC機能	あり
冷却方法	Passive
NVLink	NVIDIA NVLink Bridge 2-way low profile（2slot）
vGPU ソフトウェア対応	NVIDIA GRID®、NVIDIA Quadro® 仮想データセンターワークステーション、NVIDIA 仮想コンピュートサーバー
サポートされている vGPU プロファイル	1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB
外形寸法	266.7mm（幅）× 111.15mm（高さ）× 37mm（厚さ） 2スロットサイズ

販売終了製品：NVIDIA® T4

製品名	Tesla T4
CUDAコアプロセッサ数	2560 コア
Tensorコア数	320 コア
FP32	8.1 TFLOPS
混合精度 (FP16/FP32)	65 FP16 TFLOPS
INT8 精度	130 INT8 TOPS
INT4 精度	260 INT4 TOPS
単精度浮動小数点性能	8.1 TFLOPS
メモリ	16 GB GDDR6
帯域幅	320+ GB/秒
最大消費電力	70 W

(*1) オンボードグラフィックスとの共存ができない場合もございますのでNVIDIA Quadro®との組み合わせでのご利用を推奨致します。

販売終了製品：NVIDIA V100 / V100s

製品名	NVIDIA V100	NVIDIA V100S
GPU アーキテクチャ	GV100 (Volta)
製造プロセス	12nm
NVIDIA Tensor コア	640
NVIDIA CUDA コア	5120
コアクロック (GPU Boost時)	~1370MHz	-
Tensor演算性能	112TFLOPS	130TFLOPS
半精度浮動小数点演算性能 [FP16]	28TFLOPS	-
単精度浮動小数点演算性能 [FP32]	14TFLOPS	16.4TFLOPS
倍精度浮動小数点演算性能 [FP64]	7TFLOPS	8.2TFLOPS
メモリ容量	32GB HBM2	32GB HBM2
メモリインターフェイス	4096-bit HBM2	-
メモリ帯域幅	900GB/s	1134GB/s
L2キャッシュ	6MB	-
L1キャッシュ	10MB	-
最大消費電力	250W

※会社名及び製品名等は、当社及び各社の商標または登録商標です。価格、写真、仕様等は予告なく変更する場合があります。製品の色調及び仕様は実際と異なる場合があります。

ハードウェア一覧

オプション製品一覧

キャンペーン情報

現在開催されているお得なキャンペーン情報はこちらから。

詳細
ご購入前の
お問合せ・お見積もり

フォームにご入力いただければ後ほど営業よりご連絡させていただきます。

詳細
保守・サポート

弊社のHPC製品には、3年間のセンドバック保守サービスが付属します。
（一部、１年間のセンドバック保守の機種もございます。）
詳細はこちらをご確認ください。

詳細