VASPは密度汎関数法による平面波・擬ポテンシャル基底を用いた第一原理電子状態計算プログラムパッケージです。(公式HP)
2018年4月3日時点での最新版は、Version 5.4.4 patch1 ( patch.5.4.4.16052018 ) となります。
今回のベンチマーク環境は以下となります。
第2世代環境 (第2世代インテルXeonスケーラブルプロセッサ) |
第1世代環境 (第1世代インテルXeonスケーラブルプロセッサ) |
|
CPU | Xeon Platinum 8268 x 2 ( 2.9GHz/24Core ) x 2 | Xeon Gold 6154 ( 3.0 GHz/18Core ) x 2 |
Memory | 192 GB :16 GB( DDR4 2933 MHz ) x 12 | 92 GB :8 GB( DDR4 2666 MHz ) x 12 |
HDD | SATA 1TB HDD x 1 | SATA 1TB HDD x 1 |
OS | CentOS 7.5 | CentOS 7.4 |
Compiler | インテル🄬 Parallel Studio XE 2018 Update 2 | |
MPI | インテル🄬 MPIライブラリー 2018 Update 2 | |
BLAS | インテル🄬 Parallel Studio XE 2018 Update 2同梱のMKL | |
VASP | Version 5.4.4 patch1 ( patch.5.4.4.16052018 ) | |
Input | 1000原子 PAW GGA計算 |
上記のとおり、今回のベンチマークでは 1000原子でのPAW GGA計算のインプットを使用しています。
ベンチマーク結果ですが、以下のようになりました。
表中一番右の列は性能比で、第1世代環境の性能を100とした場合の第2世代環境の性能値となります。
VASP 1000原子 PAW GGA計算 |
第2世代環境 ( Platinum 6286) |
第1世代環境 ( Gold 6154 ) |
性能比 (第1世代環境=100) |
1node 8core | 1923 | 2033 | 105.7 |
1node16core | 1138 | 1364 | 119.9 |
1node32core | 852 | 1017 | 119.4 |
HPL、Amberとは異なり、ノード内のコア数を増やした場合の第2世代環境の性能向上率が高く、パフォーマンスが最大20%近く向上する、という結果が得られました。
VASPはHPLやAmberと比べ、CPU-メモリ間通信(メモリバンド)に対する性能要求が高いという特徴があり、この部分の性能がボトルネックになるケースが多いという知見があります。
第2世代インテルXeonスケーラブルプロセッサは第1世代インテルXeonスケーラブルプロセッサに比べ、メモリの動作周波数が増加しているため、メモリバンドの性能向上があります。
VASPのノード内の多並列時の性能向上については、このメモリバンド性能の向上が一つの原因であると考えられます。
弊社HPにて、VASP を含むベンチマーク結果について、測定データを増やした、より詳細な報告書を公開しております。
興味のある方は、こちらのサイトも是非参照ください。