GPU搭載製品ラインナップ

ホーム » HPCソリューション » GPU搭載製品ラインナップ » HPC5000-XBWGPU10R4S 特長

| 特長 | 仕様 | 価格 | 対応アプリケーション | 製品一覧 | 製品カタログ |

HPC5000-XBWGPU10R4Sの特長

インテル® Xeon® プロセッサー E5-2600 v4 ファミリー、NVIDIA® Tesla® シリーズGPU対応
4UサイズのスーパーハイエンドGPGPUラックマウントサーバー
HPC5000-XBWGPU10R4S_main_small HPC5000-XBWGPU10R4S
HPC5000-XBWGPU10R4Sは、インテル® Xeon® プロセッサー E5-2600 v4 ファミリーと、NVIDIA® Tesla® シリーズGPUに対応したスーパーハイエンドGPGPUラックマウントサーバーです。4Uサイズのラックマウント筐体に、最大2CPU(44コア)、1.5TBメモリ、2.5型 SAS/SATA HDDを24台、GPGPUカードを10基搭載可能です。
HPC5000-XBWGPU10R4S_main_open2_banner HPC5000-XBWGPU10R4S_front_banner HPC5000-XBWGPU10R4S_rear_banner HPC5000-XBWGPU10R4S_topview_banner NVIDIA_Tesla_M40_banner HPC5000-XBWGPU10R4S_mb_banner

製品の特長

■ NVIDIA® Tesla® シリーズを最大10基搭載可能

nvidia_tesla_logoHPC5000-XBWGPU10R4Sは、NVIDIA® Tesla® シリーズを最大10基搭載可能※です。
GPGPUとは、General-Purpose computing on Graphics Processing Units の略で、GPUの演算資源を汎用の計算に応用する技術のことです。NVIDIA社が提供するGPGPU専用の統合開発環境 CUDA(クーダ)によって、単純なデータを一度に大量に処理することに非常に高いパフォーマンスを発揮します。

■ インテル® Xeon® プロセッサー E5-2600 v4 ファミリーを最大2CPU(44コア)搭載可能badge-xeon

HPC5000-XBWGPU10R4Sは、14nm世代の最新CPU、インテル® Xeon® プロセッサー E5-2600 v4 ファミリーを最大2CPU(44コア)、1.5TBメモリ、2.5型 SAS/SATA HDDを24台搭載可能です。

インテル® Xeon® プロセッサー E5-2600 v4 ファミリーの仕様
プロセッサー・
ナンバー
コア数 動作周波数 AVX時
動作周波数
Last Level
Cache
QPIリンク速度 DDR4周波数 TDP 1CPUのピーク性能
(倍精度)
E5-2699A v4 22 2.4GHz N/A 55MB 9.6GT/s 2400 / 2133 / 1866 / 1600 145W N/A
E5-2699 v4 2.2GHz 1.8GHz 55MB 9.6GT/s 2400 / 2133 / 1866 / 1600 145W 633.6Gflops
E5-2697 v4 18 2.3GHz 2.0GHz 45MB 9.6GT/s 2400 / 2133 / 1866 / 1600 145W 576.0Gflops
E5-2695 v4 2.1GHz 1.7GHz 45MB 9.6GT/s 2400 / 2133 / 1866 / 1600 120W 489.6Gflops
E5-2697A v4 16 2.6GHz 2.2GHz 40MB 9.6GT/s 2400 / 2133 / 1866 / 1600 145W 563.2Gflops
E5-2683 v4 2.1GHz 1.7GHz 40MB 9.6GT/s 2400 / 2133 / 1866 / 1600 120W 435.2Gflops
E5-2690 v4 14 2.6GHz 2.1GHz 35MB 9.6GT/s 2400 / 2133 / 1866 / 1600 135W 470.4Gflops
E5-2680 v4 2.4GHz 1.9GHz 35MB 9.6GT/s 2400 / 2133 / 1866 / 1600 120W 425.6Gflops
E5-2660 v4 2.0GHz 1.7GHz 35MB 9.6GT/s 2400 / 2133 / 1866 / 1600 105W 380.8Gflops
E5-2687W v4 12 3.0GHz 2.6GHz 30MB 9.6GT/s 2400 / 2133 / 1866 / 1600 160W 499.2Gflops
E5-2650 v4 2.2GHz 1.8GHz 30MB 9.6GT/s 2400 / 2133 / 1866 / 1600 105W 345.6Gflops
E5-2640 v4 10 2.4GHz 2.0GHz 25MB 8.0GT/s 2133 / 1866 / 1600 90W 320.0Gflops
E5-2630 v4 2.2GHz 1.8GHz 25MB 8.0GT/s 2133 / 1866 / 1600 85W 288.0 Gflops
E5-2667 v4 8 3.2GHz 2.6GHz 25MB 9.6GT/s 2400 / 2133 / 1866 / 1600 135W 332.8Gflops
E5-2620 v4 2.1GHz 1.8GHz 20MB 8.0GT/s 2133 / 1866 / 1600 85W 230.4Gflops
E5-2609 v4 1.7GHz 1.7GHz 20MB 6.4GT/s 1866 / 1600 85W 217.6Gflops
E5-2643 v4 6 3.4GHz 2.8GHz 20MB 9.6GT/s 2400 / 2133 / 1866 / 1600 135W 268.8Gflops
E5-2603 v4 1.7GHz 1.7GHz 15MB 6.4GT/s 1866 / 1600 85W 163.2Gflops
E5-2637 v4 4 3.5GHz 3.2GHz 15MB 9.6GT/s 2400 / 2133 / 1866 / 1600 135W 204.8Gflops
E5-2623 v4 2.6GHz 2.2GHz 10MB 8.0GT/s 2133 / 1866 / 1600 85W 140.8Gflops

■ マルチGPUを効率的に制御し、高速処理を実現

HPC5000-XBWGPU10R4Sは、従来製品(HPC5000-XBWGPU8R4S)と比べて、搭載可能GPU数が8基から10基に増加しただけでなく、マルチGPUを効率的に制御し、より高速な処理を実現できるように改良されています。
全てのGPUがPCI Express switchを通じ1つのCPUに接続されているため(下右図)、2つのCPUに分けて接続されている従来製品(HPC5000-XBWGPU8R4S, 下左図)と比べGPU間通信のレイテンシが大幅に改善されています。
複数のGPUを使用し、GPU間通信を頻繁に行う大規模な計算を実施する際、このレイテンシの低減は計算速度の高速化に大きく貢献します。
特に深層学習(Deep Learning)の分野などにおいてNVIDIAのNCCL(マルチGPU集合通信ライブラリ)を使用する計算では、HPC5000-XBWGPU10R4Sのこの新しいアーキテクチャにより、新次元の性能を発揮することが期待できます。

新機能


■ 前面からアクセスできるHDDエンクロージャに最大24台の2.5型 HDDが搭載可能HPC5000-XBWGPU10R4S_hotswap

HPC5000-XBWGPU10R4Sは、2.5型 SAS/SATA HDDを最大24台搭載可能です。HDDは前面からアクセスできるホットスワップエンクロージャに収納され、レバー操作で交換できるため、メインテナンス作業が容易に行えます。



■ 最上位 80PLUS TITANIUM 認証を取得した高効率電源を搭載80plus_titanium_logo

HPC5000-XBWGPU10R4Sは、80PLUSで最上位ランクの80PLUS TITANIUM認証を取得した高効率な電源を搭載しています。80PLUS認証とは、交流から直流への変換効率を保証するものです。80PLUS TITANIUM認証は、負荷率10%/20%/50%/100%でそれぞれ90%/92%/94%/90%という高い変換効率基準をクリアしたものだけに与えられます。

■ 冗長化電源搭載による高い障害耐性

HPC5000-XBWGPU10R4Sは、100Vから240Vに対応した2000W電源ユニットを4個搭載し、電源ユニットに障害が発生した場合でもサーバーの運転を継続するための電力を充分に供給できる冗長性を持っています。これにより万が一の電源ユニット障害によるダウンタイムを最小限に抑えることが出来ます。

■ IPMI2.0 (Intelligent Platform Management Interface 2.0) が高度な遠隔監視、操作を実現

標準搭載されたIPMI2.0機能は専用のLANポートを備え、リモートによる温度、電力、ファンの動作、CPUエラー、メモリーエラーの監視を可能にします。また電源のオンオフ、コンソール操作を遠隔から行うことができます。これらの機能によりシステムの信頼性、可用性を高め、ダウンタイムとメインテナンス費用を圧縮することを可能にします。


Pascal アーキテクチャGPU NVIDIA® Tesla® P100

新しい NVIDIA® Pascal™ アーキテクチャの導入により、Tesla® P100はHPCやハイパースケールワークロードに対する最高水準の性能を獲得し、ディープラーニングの刺激的な可能性を切り拓くのに最適なアーキテクチャです。
また、Tesla® P100は半導体からソフトウェアまで新しい発想で構成され、随所に革新的な技術を使用しており、それぞれの先駆的テクノロジがパフォーマンスの劇的な飛躍をもたらし、世界最速の計算ノード開発を推進しています。

Tesla® P100 for PCI-e-Based Servers 仕様
CUDAコア 3584
CUDAコア周波数 1.126GHz(GPU Boost時最大1.303GHz)
半精度浮動小数点数演算性能 16.14TFLOPS(GPU Boost時 18.68TFLOPS)
単精度浮動小数点数演算性能 8.07TFLOPS(GPU Boost時 9.34TFLOPS)
倍精度浮動小数点数演算性能 4.04TFLOPS(GPU Boost時 4.67TFLOPS)
メモリ容量 (ECCオフ) 16 GB, 12 GB
メモリバンド幅 732GB/s (16GB), 549GB/s (12GB)
消費電力 250W
放熱機構 Passive(ファン無し)
TESLA P100 アクセラレータの特徴と利点

Tesla P100 は半導体からソフトウェアまで新しい発想で構成され、随所に革新的な技術を使用しています。それぞれの先駆的テクノロジがパフォーマンスの劇的な飛躍をもたらし、世界最速の計算ノード開発を推進しています。

Pascal アーキテクチャによる指数関数的なパフォーマンス向上
exponential-performance-leap

新しい NVIDIA Pascal™ アーキテクチャの導入により、Tesla P100 は HPC やハイパースケールワークロードに対する最高水準の性能を獲得しました。18.7 TFLOPSにも及ぶ半精度浮動小数点演算性能(FP16)を備えた本製品は、ディープラーニングの刺激的な可能性を切り拓きます。


CoWoS と HBM2 がもたらす、かつてない効率
unprecedented-efficiency

Tesla P100 は HBM2 テクノロジを実装した CoWoS (Chip on Wafer on Substrate) を組み込んで、コンピューティングとデータを同一パッケージに統合し、前世代の 3 倍を超えるメモリ性能を実現しています。


簡潔なプログラミングを可能にするページマイグレーションエンジン
page-migration-engine

ページマイグレーションエンジンのおかげで、開発者はデータの動きを管理することに気をとられず、コンピューティング性能のチューニングに集中できます。GPU の物理メモリサイズを超えて、最大 2 TBまでアプリケーションを展開できるようになりました。


HPC分野に特化したKeplerアーキテクチャGPU NVIDIA® Tesla® Kシリーズ
K40_architecture

単精度と倍精度演算においてテラフロップスのパフォーマンスを実現するNVIDIA® Kepler GPUコンピューティング・アクセラレータは、世界最速かつ最も効率的なHPC向けコンパニオン・プロセッサです。前世代のFermiアーキテクチャと比較して、ワット当たり3倍の性能を実現するKeplerアーキテクチャに基づいて設計されたTesla Kepler GPUコンピューティング・アクセラレータにより、ハイブリッドコンピューティングが劇的に簡単になり、より多くの科学計算アプリケーションにてその優れたパフォーマンスを適用する事が出来ます。


NVIDIA® Tesla® K80

Tesla® K80は、科学技術計算分野において、最も困難だと考えられている課題への対処を念頭に開発されました。Tesla® K80 1基あたりの浮動小数点数演算性能は、単精度で5.60TFLOPS(GPU Boost時 8.74TFLOPS)、倍精度で1.87TFLOPS(GPU Boost時 2.91TFLOPS)の超弩級パフォーマンスを実現します。24GBの大容量GDDR5メモリと、GPUパワーを効率よく利用可能にするGPU Boost™など新しい機能を搭載し、AMBER、GROMACS、NAMD、LAMMPS、Quantum Espressoなどのアプリケーションにおいて、より大規模で高速なGPUコンピューティングを可能にする計算性能を提供します。

tesla-k80_architecture01 tesla-k80_architecture02 tesla-k80_architecture03

Kepler世代の最上位GPUアクセラレーター

Tesla® K80は、2014年12月現在の最新アーキテクチャ Kepler を採用したNVIDIA® Tesla® シリーズの最上位モデルです。Tesla® K40と比較すると、Tesla® K80では、CUDAコア数が2,880基から4992基に増加、メモリ容量が12GBから24GBに倍増したほか、メモリバンド幅が288GB/sから480GB/sに向上しています。

最新GPUチップGK210を搭載

Tesla® K80は、新たに登場したGPUチップ GK210を2ユニット搭載しています。
GK210は、Tesla® K40に搭載されたGK110Bと比べて、SMX(Streaming Multiprocessor eXtreme)あたりのレジスタファイルの容量が256KBから512KBに、シェアードメモリの容量が64KBから128KBに倍増しています。GPUはより長い時間ビジーになることができます。これは外部メモリとの送受信の削減、アプリケーションの実行効率向上と性能向上に寄与します。

さらに、Tesla® K80では、CPUからの×16のPCI Express 3.0を2ユニットのGK210に接続するためにPLX PCI Expressスイッチを使用しています。このスイッチは2ユニットのGK210間の接続もサポートしており、一方のGK210が他方のGK210のメモリにアクセスする場合には、外側のPCI Expressを使用せず、PLX PCI Expressスイッチ経由で直接データ転送できるように設計されています。

GK210_architecture
K80_BlockDiagram

Tesla® K80の主な特長

NVIDIA® Tesla® K80 ※1 仕様
CUDAコア 4992(GPU毎に2496)
CUDAコア周波数 562MHz(GPU Boost時、最大周波数810MHzまたは875MHzを選択可能)※2
単精度浮動小数点数演算性能 5.61TFLOP(GPU Boost時 8.74TFLOPS)
倍精度浮動小数点数演算性能 1.87TFLOP(GPU Boost時 2.91TFLOPS)
メモリ容量 (ECCオフ) ※3 24GB(GPU毎に12GB)
メモリバンド幅 480GB/sec.(GPU毎に毎秒240GB/sec.)
消費電力 300W
放熱機構 Passive(ファン無し)

※1 Tesla K80 仕様は 2 つの GPU の集合として表示されています。
※2 GPU Boostの最大周波数値は、NVIDIAドライバに含まれているnvidia-smiツールにて設定します。
※3 ECC機能を有効にすると使用可能なメモリは10%減少します。

ベンチマーク情報

NVIDIA® Tesla® K40

NVIDIA® Tesla® K40は、最新GPUアーキテクチャ Kepler をベースに設計されたGPGPUカードです。NVIDIA® Tesla® K40 1基あたりの浮動小数点数演算性能は、単精度で4.29TFLOPS、倍精度で1.43TFLOPSの超弩級パフォーマンスを実現します。12GBの大容量GDDR5メモリと、GPUパワーを効率よく利用可能にするGPU Boostなど新しい機能を搭載し、科学計算分野において、より大規模で高速なGPUコンピューティングを可能にする計算性能を提供します。

史上最高のパフォーマンスを実現したGPUアクセラレータ

TeslaK40_kaisetsuNVIDIA® Tesla® K20Xと比較すると、NVIDIA® Tesla® K40では、CUDAコア数が2688から2880に増加、メモリ容量が6GBから12GBに倍増したほか、CUDAコア周波数も732MHzから745MHzと向上(GPU Boost時には810MHz、あるいは875MHzに上昇させることが可能です)、メモリバンド幅は250GB/sから288GB/sに向上しています。さらに、CPUとの接続がPCI Express 2.0から3.0に変更され、バンド幅が4GB/s×2から8GB/s×2と倍増しています。

GPU Boost

gpu_boost従来定格で動作していたCUDAコア周波数を、CUDAコアに余力がある場合に可能な限り増大させることで、より効率良くGPUを使用します。また、ユーザーはCUDAコアがサポートしている範囲でCUDAコア周波数を任意に変更することが可能になり、用途に合わせて、周波数を高めて計算効率を向上させるほか、周波数を抑えて消費電力を抑制することもできます。

PCI Express 3.0に対応

PCI Express 3.0に対応し、PCI Expressバスの理論転送性能が従来の2倍に向上しました。PCI Express3.0対応システムでは、ホスト・デバイス間やデバイス・デバイス間のデータ転送にかかる時間を半減させることができます。

NVIDIA® Tesla® K40 仕様
CUDAコア 2880
CUDAコア周波数 745MHz ※ GPU Boost時、最大周波数810MHzまたは875MHzを選択可能です
単精度浮動小数点数演算性能 4.29TFLOPS
倍精度浮動小数点数演算性能 1.43TFLOPS
メモリ容量 (ECCオフ) 12GB
メモリバンド幅 288GB/sec
消費電力 235W

※ GPU Boostの最大周波数値は、NVIDIAドライバに含まれているnvidia-smiツールにて設定します。

ベンチマーク情報

複雑なCUDAのマシンのセットアップが不要

uda_logomark

HPC5000-XBWGPU10R4Sは、OSとCUDA Toolkitをプリインストールした状態でお届けしますので、すぐに計算を開始することができます。

CUDA対応アプリケーション

多くのアプリケーションが続々とCUDAに対応しています。HPCシステムズのHPC5000-XBWGPU10R4Sなら、CUDA化されたアプリケーションの活用に最適です。

HPCクラスターを届いたその日から利用

HPCシステムズが提供するSystem Integration Packをご利用いただければ、用途に合わせた最適な構成選択を行い、オペレーティングシステムのインストール、ネットワーク設定からNTPによるクラスター内の時刻設定のセットアップ、NISによるユーザ認証情報の一括管理やNFSによるホーム領域の共有をはじめMPIセットアップやジョブ管理システムのセットアップなどHPCクラスターに必要なセットアップを済ませたうえでお届けしています。お客様は導入したその日から性能・安定性・操作性の高い計算機ソリューションを利用して研究、業務に専念することができます。

各種アプリケーションに対応

科学技術計算やCAE解析の各種アプリケーションについて社内で動作検証・性能確認を行い、環境設定まで含めてセットアップしています。ご導入にあたってお手持ちのインプットを使用したベンチマークテストも可能です。アプリケーションに合わせて最適なシステム構成をご提案いたします。

関連情報

【免責事項:外部リンクについて】弊社は本サイトへリンクを張っている第三者のサイト(以下、外部リンクといいます)の確認を行っておりません。また弊社は外部リンクの内容およびお客さまの外部リンクの使用に関連して発生したいかなる損害に対しても責任を負いません。 本サイトから第三者のサイトへリンクしていることが、当該サイトの商品やサービスを保証するものでもなく、また外部リンクにある情報は、 弊社が保証したものでも、認めたものでもありません。あらかじめご了承くださいますようお願いします。

お問い合わせ

■ フォームからのお問い合わせ

お問い合わせは以下のフォームよりお願いいたします。うまく送信されない場合は、メールでお問い合わせください。

お問い合わせフォーム

■ 電話・FAXでのお問い合わせ

number

【免責事項】