HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

第2世代IntelXeonスケーラブルプロセッサベンチマーク:VASP

VASPは密度汎関数法による平面波・擬ポテンシャル基底を用いた第一原理電子状態計算プログラムパッケージです。(公式HP)
2018年4月3日時点での最新版は、Version 5.4.4 patch1 ( patch.5.4.4.16052018 ) となります。

今回のベンチマーク環境は以下となります。

  第2世代環境
(第2世代インテルXeonスケーラブルプロセッサ)
第1世代環境
(第1世代インテルXeonスケーラブルプロセッサ)
CPU

Xeon Platinum 8268 x 2 ( 2.9GHz/24Core ) x 2 Xeon Gold  6154 ( 3.0 GHz/18Core ) x 2
Memory

192 GB :16 GB( DDR4 2933 MHz ) x 12 92 GB :8 GB( DDR4 2666 MHz ) x 12
HDD

SATA 1TB HDD x 1 SATA 1TB HDD x 1
OS CentOS 7.5 CentOS 7.4
Compiler インテル🄬 Parallel Studio XE 2018 Update 2
MPI インテル🄬 MPIライブラリー 2018 Update 2
BLAS インテル🄬 Parallel Studio XE 2018 Update 2同梱のMKL
VASP Version 5.4.4 patch1 ( patch.5.4.4.16052018 )
Input 1000原子 PAW GGA計算

上記のとおり、今回のベンチマークでは 1000原子でのPAW GGA計算のインプットを使用しています。

ベンチマーク結果ですが、以下のようになりました。
表中一番右の列は性能比で、第1世代環境の性能を100とした場合の第2世代環境の性能値となります。

VASP のベンチマーク結果 ( Elapsed Time(s) )
VASP
1000原子 PAW GGA計算
第2世代環境
( Platinum 6286)
第1世代環境
( Gold 6154 )
性能比
(第1世代環境=100)
1node 8core 1923 2033 105.7
1node16core 1138 1364 119.9
1node32core 852 1017 119.4

HPL、Amberとは異なり、ノード内のコア数を増やした場合の第2世代環境の性能向上率が高く、パフォーマンスが最大20%近く向上する、という結果が得られました。
VASPはHPLやAmberと比べ、CPU-メモリ間通信(メモリバンド)に対する性能要求が高いという特徴があり、この部分の性能がボトルネックになるケースが多いという知見があります。
第2世代インテルXeonスケーラブルプロセッサは第1世代インテルXeonスケーラブルプロセッサに比べ、メモリの動作周波数が増加しているため、メモリバンドの性能向上があります。
VASPのノード内の多並列時の性能向上については、このメモリバンド性能の向上が一つの原因であると考えられます。

弊社HPにて、VASP を含むベンチマーク結果について、測定データを増やした、より詳細な報告書を公開しております。
興味のある方は、こちらのサイトも是非参照ください。