HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

「IPC」で見る!最新インテル Core Ultra シリーズ 2 「Arrow Lake」の実測データを公開

× banner banner

インテル Core Ultra シリーズ 2 「Arrow Lake」が発売開始

CPUの性能向上はマルチコアやマルチスレッドなどの技術導入により多角的に進化しています。本記事では、インテルのCPUを対象に実測値に基づく性能比較を行い、IPC(Instructions Per Cycle)の向上や各世代のベンチマーク結果を解析します。CPUアーキテクチャの進化とその実際の性能を深掘りすることで、次世代のコンピューティングの方向性を見据え、システム選定に役立てることを目指しています。

インテル Core Ultra (シリーズ 2) 「Arrow Lake」を追加しました。(更新:2024/11/26)

《COLUMN》Arrow Lakeとハイパースレッディングテクノロジー(HTT)

Arrow Lakeの中身はTSMC製

Arrow Lake(アローレイク)は、インテルのデスクトップおよびゲーミングノート向け「Core Ultra シリーズ2」のコードネームです。

インテルのデスクトップ向けCPUとして初めて「タイルデザイン」を採用。この設計では、異なるプロセスで製造された回路(タイル)を組み合わせることで、製品展開の柔軟性を高めています。構成は以下のとおりです。

  • コンピュートタイル:TSMC「N3B」
  • GPUタイル:TSMC「N5P」
  • SoC/I/Oタイル:TSMC「N6」

また、AI処理向けにNPU(Neural Processing Unit)も搭載され、次世代の計算能力をさらに強化しています。

これらのタイルは、インテルが製造したベースタイルの上に置かれ、配線されて1基のCPUとなります。

削除されたハイパースレッディングテクノロジー(HTT)

Arrow Lakeでは、P-core(パフォーマンス・コア)のHTT機能が削除されました。HTTはSMT(Symmetric Multi-Threading:対称型マルチスレッディング)技術で、1つの物理コアを2つの論理コアとして動作させ、複数のスレッドを効率よく処理する仕組みです。これにより、メモリ待機中の無駄を減らし、コアの利用効率を向上させます。

HTTを有効にすると、20~30%性能向上が期待できる一方で消費電力が増加するとの報告があります。ただし、性能向上の度合いはアプリケーションによって異なります。

Alder Lake以降ではThread Directorが導入され、コアの利用を最適化しています。Thread Directorは、アプリケーションの要求に基づきP-coreとE-core(高効率コア)を効率的に割り当てる技術です。この結果、CGレンダリングや動画エンコードなど全コアを使用する用途以外ではHTTの効果が薄れ、非効率となるケースが増加。そのためArrow LakeではHTTの機能が削除されました。

余談:AMDのSMT技術について

AMDもSMT技術を採用していますが、特筆すべきは、最新のZen 5アーキテクチャでは一部のワークロードで大幅な性能向上が報告されています。また、消費電力の増加が小さいことから、非常に効率的な設計であることがうかがえます。この点で、インテルとAMDの設計思想の違いが浮き彫りになっていると言えるでしょう。

CPUアーキテクチャの進化

かつては動作周波数の高速化のみが注目されていたCPUの高性能化ですが、近年ではマルチコアやHTT(ハイパースレッディングテクノロジー)など多岐にわたる技術が導入され、進化しています。以下に、その主要な進化の要素を挙げます。

  • 命令セットの進化
  • CPU処理ユニットの進化
  • キャッシュの進化
  • マルチコアの進化
  • 回路構成の進化
  • 製造技術の進化

本記事では、実測値に基づいてCPUの性能比較を行い、進化の速度や比較の指針について分かりやすく解説します。

ムーアの法則

ムーアの法則とは、1965年にフェアチャイルドセミコンダクターのゴードン・ムーア氏が提唱した経験則で、「集積回路上のトランジスタ数は毎年2倍になる」という経験則に基づいています。1975年にはこの予測が「2年ごとに2倍になる」と修正されました。以降、この法則は「ムーアの法則」として広く知られるようになり、半導体産業の指針となっています。

CPUの性能とは

一般にCPUの性能は、以下の式で示されます。

CPU性能=動作周波数×IPC

IPC(Instructions Per Cycle)は、1サイクルあたりにCPUが処理できる命令の数を示します。性能を向上させるには、動作周波数とIPCの両方を引き上げる必要があります。

しかし、IPCの向上は容易ではありません。x86の命令セットは並列処理を考慮して設計されておらず、動作周波数の向上もプロセス技術の進化なしには難しいためです。各メーカーは、これらの制約を克服するためにさまざまな技術革新を行ってきました。

動作周波数を固定にしたベンチマークの意義

本記事では、インテル CPUの世代ごとの進化を評価します。世代や製品カテゴリーごとに動作周波数やコア数が異なるため、動作周波数とコア数を固定し、各CPUのIPC(Instructions Per Cycle)を比較しています。動作周波数を固定することで、各CPUのIPCの違いを純粋に評価することが可能となります。

IPCが⾼いということは「同じ動作周波数でより⾼性能を発揮する」ことを意味します。

ベンチマークの条件は、動作周波数を3.2 GHz、コア数を4コア8スレッドに固定して⾏います。この設定により、各世代のCPUのIPCを正確に比較することができます。

⽐較対象のCPUは以下のとおりです。

世代 アーキテクチャ 製造プロセス マイクロアーキテクチャ
第8世代 Core Coffee Lake 14nm++ Skylake
第10世代 Core Comet Lake 14nm++ Skylake
第11世代 Core Rocket Lake 14nm++ Cypress Cove
第12世代 Core Alder Lake Intel 7 (10nm) Golden Cove + Gracemont
第14世代 Core Raptor Lake refresh Intel 7 Ultra (10nm) Raptor Cove + Gracemont
Core Ultra シリーズ 2 Arrow Lake TSMC N3B、他 Lion Cove + Skymont

「IPCのデータはどこ?」という疑問がわくかもしれませんが、掲載されている実測データはベンチマークのスコアであり、IPCの直接的な値ではありません。一般的なコンピュータ環境において、実行されるベンチマークバイナリの命令数を正確に勘定することは難しく、そのためIPCを直接算出することはできませんが、
CPU性能=動作周波数×IPC
ですので、動作周波数を固定した状態でのCPU性能(ベンチマークスコア)の差は、そのままIPCの差として見ることができます。これにより、IPCの違いをベンチマークスコアの差として評価することが可能となります。

IPCを比較するためのテスト環境

テスト環境において、すべてのCPUは、

  • 動作周波数を3.2 GHzに固定
  • 4コア8スレッド

でテストを実施します。

第12世代 Core、および第14世代 Coreは、P-core(ハイパースレッディング有効)のみを使用します。

また、Core Ultra シリーズ 2 (Arrow Lake)は、ハイパースレッディング機能が削除されたため、4コア4スレッド(P-core 4コア)と、8コア8スレッド(P-core 4コア + E-core 4コア)に固定して計測しています。

なお、3.2 GHzに固定した理由は、第8世代(Core i7-8700)の環境において動作周波数の変更設定に制限があったためです。

使用するOSは、Windows 11 Pro (22H2)です。

世代 CPU マザーボード メモリ
第8世代 Core Core i7-8700 Supermicro X11SCQ DDR4-2933
第10世代 Core Core i9-10900K ASRock Z590 Taichi DDR4-3200
第11世代 Core Core i9-11900K ASRock Z590 Taichi DDR4-3200
第12世代 Core Core i9-12900K ASUS Z790 ProArt DDR5-4800
第14世代 Core Core i9-14900K ASUS Z790 ProArt DDR5-4800
Core Ultra シリーズ 2 Core Ultra 7 265K ASUS TUF GAMING Z890-PLUS WIFI DDR5-5600

ベンチマークソフト

以下のソフトウェアを利用してベンチマークテストを行いました。

  • Cinebench R23
  • Blender (ver.3.6.0) 
    ※ Core Ultra 7 265Kは、エラーにより本バージョンでは測定不可
  • PassMark 11.0 (Build 1006)

Cinebench R23

Cinebenchは、ドイツのMAXON社が無償で提供しているベンチマークソフトウェアです。MAXON社は、3DCGソフトウェアのCINEMA 4Dを開発しており、このソフトは元々Amiga向けに開発されましたが、現在ではWindowsやMac向けのバージョンも提供されています。

今回のテストでは、CinebenchのバージョンR23を使用しました。Cinebench R23は、CINEMA 4DのデフォルトレンダリングエンジンであるRedshiftのパワーを活用し、コンピュータのCPUおよびGPUの性能を評価できます。

このソフトウェアでは、シングルスレッドとマルチスレッドの2種類の計測が可能です。シングルスレッドテストは、単一のコアの性能を評価し、マルチスレッドテストはすべてのコアを使用した場合の性能を評価します。

Cinebench R23 シングルスレッド 結果



テスト結果を比較すると、i7-8700とi9-10900Kは同じSkylakeアーキテクチャを使用しているため、シングルスレッド性能はほぼ同等(誤差範囲内)であることが確認されました。

i9-12900Kとi9-14900Kも、それぞれ異なるアーキテクチャ名(Golden CoveとRaptor Cove)を持ちながらも、性能差はほとんど見られませんでした。

Core Ultra 7 265K(Lion Cove)は、明らかに性能が向上していることが分かります。

全体として、アーキテクチャのメジャーな進化により、シングルスレッド性能が確実に向上していることが確認されました。


Cinebench R23 マルチスレッド 結果



i7-8700とi9-10900Kはシングルスレッド性能がほぼ同等である一方、マルチスレッド性能は向上していることが分かります。これは、ヒートスプレッダとCPUダイ間のSTIM(Solder Thermal Interface Material)による熱伝導性能の改善や、回路構成および製造技術の成熟によるマルチスレッド性能の最適化が行われたためと考えられます。

一方、i9-12900Kとi9-14900Kのマルチスレッド性能には約1%の差しか見られず、これは誤差の範囲内であり、性能差はほとんどないと判断されます。

Core Ultra 7 265KではHTT機能が削除されているため、P-coreのみ4コアでの4スレッド、およびP-coreとE-coreそれぞれ4コアの計8スレッドで計測を行いました。その結果、P-core 4コアのみの4スレッドでは第11世代と同程度の性能でしたが、P-coreとE-coreそれぞれ4コアの計8スレッドでは、電力効率を改善しつつ、大幅な性能向上を実現していることが確認されました。


Blender 3.6.0

オープンソースで開発されている2D/3Dコンテンツ制作ツール「Blender」には、ベンチマークテストを行い、データを共有するプラットフォーム「Blender Open Data」(opendata.blender.org)が用意されています。BlenderはWindows、Mac、Linuxに対応したマルチプラットフォームのソフトウェアであり、性能の確認や他の環境との比較に役立ちます。ベンチマークはCPUだけでなく、GPUでも実行可能です。

Blender 3.6.0 結果



Blender 3.6.0のベンチマーク結果は、Cinebench R23のマルチスレッド性能と同様の傾向を示しました。ただし、i9-11900Kはclassroomベンチマークでi9-12900Kやi9-14900Kよりも高いスコアを記録しました。生成するモデルによりスコアの伸び率に多少の変化があることも確認されました。

Core Ultra 7 265Kは、エラーにより本バージョンでは測定ができませんでした。

PassMark 11.0

PassMarkは、オーストラリアのPassMark Software社が提供するベンチマーク測定ソフトウェアおよびサービスです。このソフトウェアは、「CPU」「2Dグラフィックス」「3Dグラフィックス」「メモリ」「ディスク速度」の5項目について複数のベンチマークを行い、詳細な数値化を行います。今回は、CPUのベンチマークのみを計測しました。

PassMark 11.0 結果



PassMark(マルチスレッド性能)の結果では、Cinebenchとは異なる傾向が見られました。

i7-8700とi9-10900Kは同じSkylakeアーキテクチャですが、i9-10900Kのスコア方が高い結果となっています。

また、i9-12900Kとi9-14900Kについても、PassMarkではわずかながら差が見られました。

i9-11900KのスコアはCinebenchとは異なり、PassMarkではi9-12900Kに近いスコアを記録しました。

Core Ultra 7 265Kについては、Cinebenchの結果と同様に、P-core 4コアのみでは4スレッドの限界が見られますが、P-coreとE-coreそれぞれ4コアの計8スレッドでは、前世代と比較して大幅な性能向上が確認されました。



i7-8700とi9-10900Kのシングルスレッド性能も、マルチスレッド性能と同様にi9-10900Kのスコアの方が高い結果となっています。

一方、i9-12900Kとi9-14900Kの性能差はほとんど見られませんでした。

また、i9-11900Kは、前後の世代のCPUアーキテクチャの中間に位置する性能を示しています。

Core Ultra 7 265Kは、前世代と比較して着実に性能向上を果たしていることが分かります。

まとめ

インテル CPUの世代ごとの進化を比較し、アーキテクチャの進化によりIPCが向上していることが分かりました。

同じアーキテクチャでも、回路構成や製造技術の成熟により性能が向上する場合があるため、世代(アーキテクチャ)の異なるCPUを動作周波数のみで性能評価することはできません。

また、アーキテクチャの世代が新しくなるほど性能向上が顕著に見られますが、ベンチマークソフトウェアの種類によって向上の度合いが異なることも分かります。とくに、非常に古いソフトウェアや特殊な用途では必ずしも最新CPUが最適とは限らないため、使用環境や用途に応じた選択が重要です。

今回新たに検証対象となったCore Ultra シリーズ 2は、HTT機能の削除により評価が難しいCPUとなっています。第12世代 Core以降、特定のアプリケーションでは、パフォーマンスを向上させるためにE-coreを無効化にし、P-coreのみを使用する設定が行われる場合がありますが、この場合、Core Ultra シリーズ 2ではシングルスレッド性能は前世代より向上するものの、マルチスレッド性能は前世代と比較して低下する可能性があります。

複数のレビューサイトによりますと、Core Ultra シリーズ 2のコア性能は高いものの、最適化が不十分であり、ワークロードごとの性能にばらつきが生じるとの指摘もあります。修正BIOSリリース予定の話もありますので、今後の最適化に期待します。


産業用コンピュータならHPCシステムズ 

HPCシステムズでは信頼性の高い産業用コンピュータ/タブレットを幅広く提供しています。 

要求仕様に応じたカスタマイズのほか、中小規模での量産にも対応。仕様設計・試作・検証・生産・サポートまで徹底的にお応えいたします。

最新プロセッサー搭載コンピュータ

IPC-R670EA-R4 | 産業用コンピュータならHPCシステムズ
第14世代インテルCPU搭載画像処理・マシンビジョン向け4Uラックマウント型産業用PC
IPC-R670EM-SC | 産業用コンピュータならHPCシステムズ
第14世代intel CPU搭載画像処理・マシンビジョン向けスリムシャーシ型 産業用PC
IPC-R670EI-Mini | 産業用コンピュータならHPCシステムズ
第13世代intel CPU及び最新GPU RTX™ 4000 Ada SFF搭載 、画像処理・マシンビジョン・エッジAI向けのコンパクトな産業用PC

用途にあわせてカスタマイズ可能!
お見積りシミュレーション

HPCシステムズ BTOサイト |