HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

インテル12900Kの理論性能について


図1 第12世代インテル® Core™ i9 プロセッサー12900K

現在、第12世代インテル® Core™ i9 プロセッサー12900Kを搭載した当社ワークステーション の評価を行っています。

このCPUは、最大 8 個の高性能コア (P コア) と最大 8 個の高効率コア (E コア) からなるハイブリッド・アーキテクチャーを採用しています。インテル® スレッド・ディレクターが、Pコア/Eコアをワークロードへ適切に割り当てるということですが、そもそもの理論性能は?と思って調べました。が、どこにも見当たりません。

そこで自分で計算してみました。

表 [Core™ i9 プロセッサー12900K 理論性能]

  • 周波数は、Pコアが最大5.2Ghzまで動作する仕様のようですが8コア同時動作は5.1Ghzまでなので5.1Ghzにしています。
  • 同時計算ビットは、AVX512は 512bit、AVX2なら256bitです。
  • FMA係数は、1命令で乗算と加算の2演算ができるので2としています。なお、Eコアには FMA演算器はありませんが、毎サイクル浮動小数乗算命令と、浮動小数加算命令が発行できるので、この計算式でよいはずです。

PコアにはAVX512用の演算器がありますが、EコアにはAVX512用の演算器がありません。 したがって、WindowsではPコアでもAVX512命令は動作しないはずです。しかし、linpackをPコアだけで実行すると、AVX1命令(理論性能326GFLOPS)では説明できない性能(500GFLOPS以上)がでました。したがって、AVX2命令を複数同時動作することでAVX512命令と同じ性能が出たと推測しています。

 

第12世代Core-iシリーズでは、AVX512命令が使えず浮動小数演算性能が半分になるのではと予測していたのですが実測の結果、ハードウェアがうまくリカバリしていることがわかりました。現在、社内検証機を用いベンチマークを開始しています、結果ができ次第、情報を公開します。ご期待ください。