HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

第2世代IntelXeonスケーラブルプロセッサベンチマーク:HPL

さて、今回から第2世代インテルXeonスケーラブルプロセッサを搭載した環境において、実際にアプリケーションを動作させた場合の性能を見ていきます。

最初にベンチマークを行うアプリケーションはHPLです。

このブログを閲覧している方はHPLがどういうものなのかご存知の方も多いと思いますが、一応解説をしておきます。

HPLは連立方程式を解くスピードを測定するベンチマークで、スーパーコンピュータのランキングで有名な” Top 500 Supercomputer Sites ” でも採用されています。

このベンチマークは、CPUの演算性能と、プログラム上で実際に計算を行う演算ルーチン or 演算ライブラリ(BLAS)の性能に結果が強く依存します。
実際に科学技術計算に使用するアプリケーションでは、メモリやI/Oデバイス等、他にもパフォーマンスに影響を及ぼす要因が存在するため、HPLのベンチマーク結果(傾向)と差異が出る場合があります。
このため、HPLのベンチマーク結果は、「CPUの純粋な演算性能の指標である」という認識を持つことが重要である、と個人的には考えています。

さて、では実際のベンチマーク結果を見ていきましょう。
今回のベンチマーク環境は以下となります。

  第2世代環境
(第2世代インテルXeonスケーラブルプロセッサ)
第1世代環境
(第1世代インテルXeonスケーラブルプロセッサ)
CPU

Xeon Platinum 8268 x 2 ( 2.9GHz/24Core ) x 2 Xeon Gold  6154 ( 3.0 GHz/18Core ) x 2
Memory

192 GB :16 GB( DDR4 2933 MHz ) x 12 92 GB :8 GB( DDR4 2666 MHz ) x 12
HDD

SATA 1TB HDD x 1 SATA 1TB HDD x 1
OS CentOS 7.5 CentOS 7.4
Compiler インテル🄬 Parallel Studio XE 2018 Update 2
MPI インテル🄬 MPIライブラリー 2018 Update 2
BLAS インテル🄬 Parallel Studio XE 2018 Update 2同梱のMKL
HPL Version 2.3

本当は Xeon Platium 8268 と Xeon Platinum 8168 で比較したかったのですが、社内環境に Platinum 8168 が無かったので、動作クロックが一番近かった Gold 6154 を比較対象としています。

さて気になる結果ですが、以下のようになりました。
表中一番右の列は性能比で、第1世代環境の性能を100とした場合の第2世代環境の性能値となります。

HPLのベンチマーク結果 ( GFlops )
HPL N=100000 第2世代環境(Platinum 6286) 第1世代環境(Gold 6154 ) 性能比
(第1世代環境=100)
1node 8core 662.68 596.29 111.13
1node16core 1195.7 1083.5 109.43
1node32core 1836.1 1548.1 118.60

…あれ、動作周波数が低い第2世代の方が良い結果出てる。
HPLは値がある程度ばらつくので数回やり直しましたが、傾向は同じ…

CPUのアーキテクチャ的には大きな差がないはずなんだけども、うーん?
というわけで、色々と調べてみたところ、” perf stat “コマンドで測定したHPL実行時のCPU動作周波数に差が見られました。

CPUの動作周波数 ( GHz )
 

第2世代環境
(Platinum 6286)

第1世代環境
(Gold 6154 )
仕様上の動作周波数 2.9 3.0
1node 8core 3.33 3.21
1node16core 3.12 3.16
1node32core 2.83 2.81

あー、なるほど。TurboBoost による動作周波数上昇幅が大きくなっていて、仕様上では0.1GHz低くても、計算時の動作周波数は同じ or やや早い という感じになっている、と。
TurboBoostの上昇値が大きくなった…。筐体設置場所の環境温度が性能に与える影響が大きくなっていてもおかしくない気がするぞ…

動作周波数がほぼ同等な 16core、32coreの結果でも、第2世代の方がやや高速な結果になっていますね。
これは何が原因なのでしょう…CPU構造にマイナーチェンジが入って性能向上したのかな? 正直良く分からないです。

弊社HPにて、HPLを含むベンチマーク結果について、測定データを増やした、より詳細な報告書を公開しております。
興味のある方は、こちらのサイトも是非参照ください。