ホーム > HPC・DL・AI > 技術情報 > ベンチマーク情報 > インテル® Xeon® プロセッサー E3-1200 v3のHPLベンチマーク評価

インテル® Xeon® プロセッサー E3-1200 v3のHPLベンチマーク評価

革新的な新アーキテクチャを採用した、インテル® Xeon プロセッサー E3-1200 v3シリーズが発表されました。
「インテル® Advanced Vector Extensions 2 (AVX2)」をはじめとする新命令を搭載し、各コアのクロック周波数あたりの理論ピーク性能を、旧来のインテル® Xeon® プロセッサーに比べて整数演算・浮動小数点数演算共に倍増させた点がまず目を惹きます。今回は、TOP 500のランキングに用いられるベンチマークとして有名なHPLを、インテル® Xeon プロセッサー E3-1200 v3シリーズで走らせ、その性能向上を検証いたしました。

インテル® Xeon プロセッサー E3-1200 v3シリーズの拡張命令

インテル® Xeon プロセッサー E3-1200 v3シリーズでは、従来のインテル® Xeon プロセッサーから以下の命令が追加されています。

  • 整数ベクトル命令の256ビット拡張と、それに関連した整数ベクトル命令の拡張
    • いわゆる「Gather」と呼ばれる非連続データのベクトルレジスタへのロード命令
    • 256ビット化された3オペランドのベクトルシャッフル命令
    • ベクトルの各要素のシフト量をベクトルレジスタで個別に指定可能なシフト命令
    • ベクトルレジスタの整数型変換命令で欠けていた組み合わせの追加
    • 「AVX2」は厳密にはこの部分のみを指す
  • 3オペランド形式のFused Multiply-Add(FMA3)と呼ばれる浮動小数点数の積和算命令
  • Transactional Synchronization Extensions(TSX)と呼ばれるトランザクショナルメモリアクセス命令
  • Bit Manipulation Instructions(BMI)と呼ばれる各種ビット演算のスカラ命令
  • 最も注目すべきは FMA3 という機能です。HPCでは行列演算が多用されますが、中でも極めて重要度の高い積和演算という処理があります。これは簡単に言うと A*B+C という計算を行うものですが、これまでの命令セットでは乗算と加算を別々の計算として、パイプラインあたりのスループットで合計2クロック必要としていました。FMA3 では、これを1つの計算としてスループット1クロックで処理できるようになりました(右図を参考)。上述の理論ピーク性能の倍増はこの命令によるものです。
E5-2600シリーズとE3-1200 v3シリーズの最上位CPUの仕様比較
プロセッサーナンバーE5-2687WE3-1280 v3
コア数84
コアあたりの論理スレッド数22
クロック周波数3.1 GHz3.6 GHz
Turbo Boost最大周波数3.8 GHz4.0 GHz
理論ピーク性能198.4 GFLOPS230.4 GFLOPS
対応メモリ周波数1600 MHz1600 MHz
メモリチャネル数42
対応メモリ合計容量750 GB32 GB
理論メモリ帯域51.2 GB/s25.6 GB/s
L3キャッシュサイズ20 MB8 MB
PCI Express 3.0レーン数4016
CPUソケットLGA2011LGA1150
対応ソケット数21
チップセットとの接続(DMI)PCI Express 2.0 × 4PCI Express 2.0 × 4
熱設計電力150W82 W
E5-2600シリーズとE3-1200 v3シリーズのCPUアーキテクチャの比較
  • インテル® Xeon® E5-2600シリーズ
  • 新世代 インテル® Xeon® E3-1200 v3シリーズ

ベンチマーク結果

今回のベンチマークは、以下の環境で測定いたしました。

CPUインテル® Xeon® プロセッサー
E5-2670
インテル® Xeon® プロセッサー
E3-1270 v3
コア数8 × 2CPUs = 164
クロック2.6 GHz3.5 GHz
理論ピーク性能332.8 GFlops224 GFlops
メモリ容量8 GB × 8 = 64 GB8 GB × 4 = 32 GB
OSRed Hat Enterprise Linux 6.1CentOS 6.4
コンパイラIntel C++ Composer XE 2011 SP1 Update 2Intel C++ Composer XE 2013 Update 4
BLASIntel MKL 10.3Intel MKL 11.0
MPIOpen MPI 1.4.4Open MPI 1.6.4
HPL2.0 (N=81000)2.1 (N=60000)
表1 ベンチマーク結果
CPUGFlopsFlop/cycle
E5-2670 ×2CPUs311.07.5
E3-1270 v3174.412.5

結論

HPLのベンチマーク値によると、インテル® Xeon® プロセッサー E3-1200 v3シリーズの単体の性能は、コア数が2倍のE5-2600シリーズの8コア製品単体の性能と同等以上の水準に達しており、新命令による性能向上が目覚ましいものであると確認できます。あえてマルチソケット構成にする必要のない小規模なシステムでございましたら、安価で消費電力も大幅に少ないインテル® Xeon® プロセッサー E3-1200 v3シリーズを、従来製品の置き換えとしてお勧めいたします。

理論ピーク性能に対して実効性能比が 78% と振るわない点ですが、高速になりすぎたCPU に対して、メモリ帯域が追いついていないことが推測されます。検証に用いたHPL は、計算アプリケーションとしては比較的メモリ帯域を要求しない部類のものになります。そのため CFD のようなメモリ帯域を要求するアプリケーションについては、期待する性能を得られない可能性があります。これはAVXを初めて搭載した初代のインテル® Xeon® プロセッサー E3-1200シリーズ登場の際にも見られた現象ですが、同様にこのアーキテクチャの本領を発揮させるには、メモリチャンネル数の増強が期待される 2ソケット版のリリースを待つ必要があるかもしれません。

HPCシステムズでは、今後も新しいCPUの性能について検証し、レポートしていきます。

インテル® Xeon® プロセッサー E3-1200 v3シリーズ対応製品

  • キャンペーン情報
    現在開催されているお得なキャンペーン情報はこちらから。
    詳細
  • ご購入前のお問合せ
    フォームにご入力いただければ後ほど営業よりご連絡させていただきます。
    詳細
  • 見積り依頼
    フォームにご入力いただければ後ほど営業よりご連絡させていただきます。
    詳細
Contact

お問い合わせ

お客様に最適な製品をご提案いたします。まずは気軽にお問い合わせ下さい。
03-5446-5531

(平日9:30~17:30土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)