SandyBridgeマイクロアーキテクチャの2ソケット対応CPUで最上位モデルとなる E5-2690(8コア,2.90GHz)を2CPU搭載した8ノードクラスターにてベンチマークを取得しました。
Product | HPC5000-XS2UTwin (2U2ノード高密度実装HPCサーバー) |
---|---|
CPU | Xeon E5-2690 (2.90GHz,8コア,20MB Cache,8.4GT/s Intel QPI) |
CPU搭載数/1ノード | 2 (16コア) |
メモリ/1ノード | 64GB |
OS | CentOS 6.2 |
Interconnect | Infiniband FDR |
Compiler | インテル® Composer XE 2011 SP1 |
HPL 2.0をインテルコンパイラーのAVX最適化を有効にしてビルドし、その性能を測りました。ピーク性能を引き出すためにより計算量の大きいN=81000の場合を測定しました。
並列数 | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 |
---|---|---|---|---|---|---|---|---|
E5-2690(8コア,2.9GHz) 実測値 | 27.39 | 53.99 | 108.5 | 212.4 | 405.25 | 782.7 | 1396 | 2020.6 |
E5-2690(8コア,2.9GHz) 理論値 ※ | 30.4 | 60.8 | 121.6 | 243.2 | 486.4 | 921.6 | 1740.8 | 3379.2 |
※理論値はTurbo Boostの効果を加味しています。1/2/3/4/5/6/7/8コア使用時に、それぞれ3.8/3.6/3.6/3.4/3.4/3.3/3.3/3.3GHzとして計算しています。
特長:Infiniband FDRを使用した場合128コアでもスケール
E5-2690×2CPU×8ノードクラスターにて、128コアで2TFlopsを達成しました。HPL(N=81000)は実用アプリケーション(下記例を参照)と比較すると、64コア~128コアにおいてもスケールしやすく、クラスターの実測でのピーク性能値として参考にできます。
インテル® Xeon® E5-2600シリーズ搭載製品についてはこちらを参照ください。
Abaqusは、Dassault Systemes Simulia社の提供する汎用有限要素解析プログラムです。高度な内容の構造解析と伝熱解析を実行することができる汎用有限要素プログラムのABAQUS/Standardと、連続体や構造物の高度な非線形解析を実行できる有限要素プログラムABAQUS/Explicitがあります。今回はABAQUS/Standardを使用しました。
並列数 | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 |
---|---|---|---|---|---|---|---|---|
E5-2690(8コア,2.9GHz) /InfiniBand | 14059 | 6609 | 3680 | 2256 | 1270 | 755 | 538 | 588 |
E5-2690(8コア,2.9GHz) /TCP | 854 |
並列数 | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 |
---|---|---|---|---|---|---|---|---|
E5-2690(8コア,2.9GHz) /InfiniBand | 4974 | 2707 | 1537 | 955 | 638 | 570 | 410 | 370 |
E5-2690(8コア,2.9GHz) /TCP | 623 | 637 | 711 |
特長:Infiniband FDRでTCPの性能飽和を打破
S4bの64コア・128コアにて、TCPでは並列性能が頭打ちとなっているのに対し、Infiniband FDR接続ではスケールしており、最短の計算時間をご要望のお客様に有用な構成となっています。一方、E1・S4bのように大並列数にて並列性能が得られにくい場合については、ご利用の計算ジョブに適した費用対効果の大きい並列数を弊社内ベンチマークにより分析し、LAVA等のジョブ管理システムを用いて計算を多重にバッチ実行することで計算機システム全体のスループットを最大化するというご提案が可能です。
インテル®Xeon®E5-2600シリーズ搭載製品についてはこちらを参照ください。
(平日9:30~17:30土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)