HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

最大56GB/s! AMD Ryzen×HighPoint RAIDカードで体感する超高速ストレージの実力

× banner banner

新製品 AMD Ryzen 搭載「WS-GR870PA-T」

当社CTO事業部では、お客様のご要望にジャストフィットする産業用コンピューターをご提供できるよう、選定・開発・生産・サポートまで一貫して対応しています。

そのCTO事業部が、AMD Ryzen 搭載ワークステーションを標準モデルとして初めて開発しました。

産業用コンピューターメーカーならではの視点から、信頼性を重視して部材を選定しています。

本機はワークステーションとして開発されており、動画編集・画像処理・CG制作・生成AIといったクリエイティブ分野でのプロフェッショナルな利用を想定しています。

10GbEの高速ネットワークを標準搭載し、さらに豊富なストレージ構成オプションも選択可能なモデルです。

WS-GR870PA-T

製品情報はこちらです。

WS-GR870PA-T | 産業用コンピュータならHPCシステムズ
動画編集・画像処理・CG・生成AI向けタワー型 ワークステーション

「WS-GR870PA-T」+「高速ストレージ」

本機を用いて、さっそくストレージ性能の検証を行いました。

まず、HighPoint社製 PCIe 5.0対応RAIDカードの検証にあたり、株式会社アスク様、ITGマーケティング株式会社様の多大なるご協力に、心より御礼申し上げます。

テスト環境

  • CPU: AMD Ryzen 9 9950X3D
  • メモリ: 256GB (DDR5-5600)
  • OS: Windows 11 IoT Enterprise LTSC (24H2) 日本語版
  • ストレージ設定: RAID構成時にストレージデバイスをフォーマットする際は、アロケーションユニットサイズ(データ保存時の最小単位)を64KBで統一
  • RAIDカード設定: すべてデフォルト値を使用

参考: PCIe の仕様

以下はPCIe Gen4/Gen5の帯域幅です。

赤枠で示した「x4」が M.2 NVMe SSD に相当します。

トップモデルの実測値(読み込み速度)は、Gen4で約7.4GB/s、Gen5で約14.5GB/s程度です。

一方、書き込み速度は読み込みよりやや低い傾向があります。


注意事項(ストレージ利用に関する一般的な留意点)

皆様ご存知のストレージのお約束ですが、念のために今一度!

  • 必要に応じて、定期的にデータのバックアップを行ってください。
  • データやプログラムの消失、またそれらの作成にかかった費用等は、メーカー保証の範囲外です。

ご参考

ベンチマーク結果は、使用する環境(CPU、メモリ、ストレージ性能、OS、ドライバ、バックグラウンドで動作するソフトウェアなど)によって大きく変動します。

本ブログで紹介するスコアは、あくまで参考値としてご覧いただければ幸いです。

ストレージ構成① 最新 PCIe 5.0 対応 M.2 SSD「Samsung 9100 PRO」

本章では、WS-GR870PA-Tに標準搭載されている Gen5 対応の最新モデル「Samsung 9100 PRO シリーズ」 を検証しました。 シリーズのラインアップは以下のとおりです。

詳細な仕様については、以下のページをご参照ください。

Samsung 9100 PRO 製品情報(ITGマーケティング株式会社様)

PCIe 5.0 ×4 インターフェースの性能を最大限に引き出し、

連続読み出し 14.7 GB/秒、連続書き込み 13.3 GB/秒 を発揮するハイエンド NVMe M.2 SSD ―

今回の検証では、その中から Samsung 9100 PRO 2TB を用いてベンチマークを行いました。

CrystalDiskMark

ベンチマークツール CrystalDiskMark を使用しました。

CrystalDiskMark - Crystal Dew World [ja]
各種ストレージ (HDD, SSD, USBメモリなど) の速度を測定するベンチマークソフトです。 ダウンロー

プロファイルを「NVMe」に設定し、以下の条件で測定しています。

  • SEQ512K Q32T4
  • SEQ512K Q32T8
  • RND512K Q32T24
  • RND512K Q32T16

ご覧のとおり、仕様どおりの性能を発揮しています。

RAID 0を組まずにこの速度が出るのは、まさにGen5だからと考えます。

「高速なストレージは欲しいけれど、安全性や運用の簡便さを考えるとRAID 0は避けたい」という方には、Gen5 M.2 SSDが有力な選択肢になるでしょう。

ただし、Gen5 M.2はGen4 M.2に比べて発熱が大きい点には注意が必要です。とはいえ、この Samsung 9100 PRO は同世代の中でも発熱が抑えられており、扱いやすい優れた製品だと感じました。

PerformanceTest 11.0 (PassMark)「DISK MARK」

続いて、PerformanceTest 11.0(PassMark) の「DISK MARK」で計測を行いました。https://www.passmark.com/products/performancetest/index.php

結果は、まさに驚異的なハイスコアとなりました。

比較の参考として、Gen4 M.2 SSD および 現在主流の 2.5インチ SATA SSD のスコアも並べています。

ぜひ下記の「High End Drive Chart」もご覧いただき、位置づけをご確認ください。

PassMark Software - Hard Drive Benchmark Charts

Blackmagic Disk Speed Test「5G」

最後に、動画編集ソフトでも知られる Blackmagic Design社 の「Blackmagic Disk Speed Test」で計測を行いました。

このツールは、ディスクの空き領域にデータサンプルを書き込み、読み込み・書き込み速度を実測するベンチマークツールです。

Blackmagic Design社の公式サイトからダウンロードできます。

Blackmagic Design
Blackmagic Designは、URSAカメラ、DaVinci Resolve、ATEMスイッチャーなど、映画、ポストプロダクション、放送業界に向けて世界最高品質の製品を開発しています。

サポート → キャプチャー・再生 → 最新のダウンロード情報 から「Desktop Video」をダウンロードし、解凍・インストールして実行します。 テスト時にはデータサイズを選択できますが、今回は 「5G」 を選択して実行しました。

本ツールの結果は、他のベンチマークよりも実使用に近い値が得られる傾向にあります。

比較のために、Gen4 M.2 SSD と 現在主流の2.5インチ SATA SSD のスコアも並べています。

Gen4 M.2は、シーケンシャルリード7,500MB/s、シーケンシャルライト6,500MB/sを誇るDRAMキャッシュ搭載の高性能・産業用温度拡張モデルですが、Gen5対応のSamsung 9100 PRO の性能はそれを圧倒する結果となりました。

シンプルな操作で手軽にベンチマークを行えますので、ぜひ皆さまもご自身のマシンで試してみてください。

ストレージ構成② PCIe 5.0対応 X870Eチップセット「AMD RAIDXpert2」

本章では、WS-GR870PA-Tでも採用しているAMD Ryzen 1000シリーズ以降のプロセッサーを搭載したマシンで利用可能な、AMDチップセット搭載RAID機能を検証しています。

上述のSamsung 9100 PRO 2TBを2枚用い、RAID 0構成で検証を行いました。

RAIDの構成は UEFI(BIOS)上で設定しますが、無償のアプリケーション 「RAIDXpert2」 を利用することで、Windows上からRAIDアレイを管理することも可能です。

▼ AMD RAIDXpert2の画面

CrystalDiskMark

Windows OSの「ディスクの管理」で構成したストライピング(ソフトウェアRAID 0)と、X870EチップセットRAID 0との比較結果です。

どちらも大きな差はなく、ほぼ同等のスコアを示しました。

SSD単体構成と比較すると、約2倍近いスループットを発揮しており、本ベンチマークにおける性能は非常に良好です。

PerformanceTest 11.0 (PassMark)「DISK MARK」

SSD単体構成時と比較すると、スコアはやや低下しています。 これは、本ベンチマークの測定方法がRAID構成向けではない可能性が考えられます。 一方で、チップセットRAIDのほうが若干高いスコアを示しており、RAIDドライバや制御方式の最適化が影響している可能性があります。

Blackmagic Disk Speed Test「5G」

このテストでは、チップセットRAIDよりもOSのストライピング構成のほうが良好なスコアを示しました。

ワークフローやアクセスパターンによって、得意・不得意が分かれるようです。

OSのストライピングであれば構築も比較的容易なため、運用面の手軽さという点では優位性があります。

2枚の Samsung 9100 PRO を用いて、特別な費用をかけずにこれだけの性能を発揮できるのは、非常に有効な選択肢といえるでしょう。

ただし、大容量データの長時間書き込みではSSDキャッシュ切れによる速度低下が発生する可能性があります。 そのため、安定した書き込み性能を求める場合は、専用のRAIDカードを使用する構成が依然として望ましいことに変わりはありません。

ストレージ構成③ HighPoint社製 PCIe 5.0対応 RAIDカード「Rocket 7608A」

いよいよ真打ちが登場です。

超高速ストレージ構成の本命ともいえる HighPoint社製 Rocket 7608A(最大8枚のGen5 M.2 SSDを搭載可能)によるベンチマークを実施しました。 今回は Samsung 9100 PRO 2TBを8枚使用しています。

本機に採用されている AMD X870Eチップセット は、PCIe Gen5 x16スロットを x8/x8 に分割して使用することが可能です。

そのため、WS-GR870PA-T に搭載されている 2 本の x16 スロットには、それぞれ GPU 用に PCIe Gen5 x8RAID カード用に PCIe Gen5 x8 の帯域を割り当てる構成で運用します。

前述の表にもあるとおり、Gen5のx8は、Gen4のx16と同等の帯域を誇ります。

実際、本機は GPU の搭載を前提とした設計となっているため、RAID カードを PCIe x16 で運用することは事実上できません。 しかし今回は検証のため、x16接続時のパフォーマンスも測定しました。

(※ 編集担当注釈:GPUを非搭載とし、RAIDカードに特化したシステム構成をご提案することも可能です。)

上位カテゴリーの CPU である AMD Ryzen Threadripper / Threadripper Pro 環境では、豊富な PCIe レーン数を活かし、複数の GPU を搭載しながら、RAID カードを PCIe x16 接続で運用することも可能です。

最新のZen 5世代 Ryzen Threadripper(Pro)は、各所のレビューでも圧倒的な性能が報告されています。

本検証結果が、そのようなハイエンド環境を検討されている方の参考になれば幸いです。

なお、現時点では当社標準ラインアップに Ryzen Threadripper(Pro)搭載モデルは含まれておりませんが、カスタムメイド対応が可能です。

それでは、Rocket 7608Aの概要についてご紹介します。

M.2 SSD 最大8基搭載可能 — PCIe 5.0対応RAIDカード

Rocket 7608A は、最大8台の2280フォームファクターの Gen5 M.2 SSD を直接接続可能な、高性能かつ高機能RAIDカードです。

最大で4つの独立した RAID 0/1/10 アレイ(ブートボリュームを含む) を構成でき、単体SSDとの混在運用にも対応しています。

株式会社アスク様 製品情報ページ

HighPoint「Rocket 7608A」製品情報
M.2 SSDを最大8基搭載可能。PCI Express 5.0接続対応のRAIDカード

本製品には Broadcom製 PCIeスイッチチップ「PEX89048」 が搭載されており、 各M.2スロットが PCIe 5.0 x4接続 に対応します。 これにより、最大56GB/sの帯域性能を発揮できると記載されています。

果たしてそのとおりの性能が得られるのか、実際にベンチマークを実施して確認しました。

テスト構成は以下のとおりです。

  • 使用SSD:Samsung 9100 PRO 2TB(4枚/8枚構成でRAID 0アレイを構築)
  • スロット構成:PCIe Gen5 x8 および PCIe Gen5 x16 接続で測定
  • Driver version:5.0.0
  • RAID Management version:v3.1.3

CrystalDiskMark

まずは Samsung 9100 PRO 2TB を4枚搭載 した結果です。

  • x8接続:PCIeスロット帯域が早い段階で飽和し、到達速度はほぼPCIe Gen5 x8の帯域上限(32 GB/s(片方向))に達しています。
  • x16接続:ランダム系は4枚構成ではまだ伸びしろが見られる一方、シーケンシャルはRAIDカードの仕様どおり最大56GB/sの帯域性能を確認できました。

つづいて Samsung 9100 PRO 2TB を8枚搭載 した結果です。

  • x8接続:4枚の時点で帯域が飽和しているため、ベンチマークスコアは概ね横ばいです。ただし、ドライブ枚数が増えた分だけキャッシュ切れによる速度低下のリスクは小さくなります。ベンチマーク値が同等でも、取り扱うデータの特性次第では実使用で差が出る可能性があります。
  • x16接続:ランダム性能は順当に向上しました。一方で、シーケンシャルリードが4枚構成よりわずかに低下する結果が見られました。体感差は小さいと考えますが、要因の切り分けは継続します。

総じて、Gen5 x16 の帯域上限に迫る結果を確認できました。

なお、より余裕のある PCIe レーン構成で運用したい場合は、AMD Ryzen Threadripper(Pro)搭載モデルのご案内も可能です。要件に応じて最適な構成をご提案しますので、ご相談ください。

Blackmagic Disk Speed Test「5G」

スコアは順調に伸びていますが、x8接続とx16接続の差はPCIe仕様から想定されるほど大きくありません

そのため、x8接続でも十分に有効なストレージ構成オプションとして運用可能であると考えます。

最大速度の伸びはやや鈍化していますが、より多くのドライブを搭載する構成や、キャッシュ容量の大きい高容量SSDの採用は、キャッシュ切れ対策として有効な手段です。

Rocket 7608A用 RAID管理ソフト

最後に、RAIDの管理ソフトについて触れておきます。

本RAIDカードの管理ソフトはWebブラウザ上で動作し、直感的に操作できるシンプルなGUIを備えています。

まず、この管理ソフトからRAIDアレイを構築します。

設定は非常に分かりやすく、短時間で作業を完了できます。以下に画面例をいくつか示します。

いかがでしたでしょうか。

Samsung 9100 PROは単体でも優れた性能を発揮しますが、ストレージ構成② やストレージ構成③のように、RAID 0を構成することでさらなるパフォーマンス向上が可能です。

高速かつ広大な作業領域を確保できる点で、非常に有効な選択肢といえるでしょう。

番外編① ASUS製 PCIe 5.0対応 RAIDカード

WS-GR870PA-T ではストレージ構成オプションとしては提供していませんが、参考情報として ASUS 社製「Hyper M.2 x16 Gen5 Card」 をご紹介いたします。

Hyper M.2 x16 Gen5 Card|Motherboards|ASUS Global
Hyper M.2 x16 Gen5 Card supports four NVMe M.2 devices, and RAID function across different CPU platforms to give DIY PC users better choices when building their...

このカードは、最大 4 枚の M.2 SSDを搭載可能な拡張カードです。

ただし、マザーボード側にPCIe x16 スロットを x4×4×4×4 に分割(bifurcation)する機能が備わっている必要があります。

そのため、UEFI(BIOS)でレーン分割設定に対応していないマザーボードでは、本来の性能を発揮できません。

また、x8 接続では Samsung 9100 PRO を 2 枚までしか使用できず、オンボードの M.2 スロット構成と実質的に大きな違いはありません。

本機で採用しなかった理由は、これらの制約によるものです。

今回は Windowsのストライピング機能チップセットRAID機能 を用いてベンチマークを測定しました。

なお、Samsung 9100 PRO 2TB は NAND が片面実装タイプです。

また、弊社の別事業部からの貸出品であるため、下側のサーマルパッドはあえて取り外していません。

CrystalDiskMark

Samsung 9100 PRO 2TBを4枚搭載時

オンボードのM.2スロット構成とは異なり、OSのストライピング構成とチップセットRAID構成との間で顕著な性能差が見られます。

しかし、期待していたほどの結果は得られず、③章で紹介したHighPoint社製 Rocket 7608A に Samsung 9100 PRO を4枚搭載した構成と比較すると、全体的に性能は劣る結果となりました。

PerformanceTest 11.0 (PassMark)「DISK MARK」

OSのストライピング構成とチップセットRAID構成では、書き込み・読み込みともに明確な性能差

が見られ、チップセットRAIDのほうが優れた結果となりました。

一方で、IOPS(入出力処理性能)については両構成とも近いスコアを示しています。

Blackmagic Disk Speed Test「5G」

こちらのテストでも、OSのストライピング構成とチップセットRAID構成の間に明確な性能差が見られ、チップセットRAIDのほうが優れた結果となりました。

番外編② Intel環境との比較

Intel環境との比較も行うため、Xeon WおよびXeon Scalable環境でベンチマークを計測しました。

これらのXeon環境は、AMD Ryzen Threadripper(Pro)環境と同様に PCIeレーン数が豊富であるため、2つの高速ストレージ間のファイル転送速度についても併せて測定しています。

今回の検証では、HighPoint社のRocket 7608Aに加え、Rocket 1608Aも株式会社アスク様よりご提供いただきました。

この場をお借りして厚く御礼申し上げます。

両製品の主な違いは次のとおりです。

  • Rocket 7608A:専用のRAID管理ツールを使用して運用可能。
  • Rocket 1608A:RAIDカード上の各 M.2 SSD が、マザーボード上の M.2 スロットに増設されたかのように通常の NVMe SSD として認識され、OS標準の機能を利用してRAIDを構築・運用します。

各Xeon環境の構成は下記のとおりです。

  • Xeon W 環境
    • 構成:当社カスタムPC
    • CPU:Intel Xeon W5-3435X(16C / 32T)
    • メモリ:96GB(DDR5 ECC RDIMM)
    • OS:Windows 11 Pro(24H2)日本語版
  • Xeon Scalable(デュアルCPU)環境
    • 機種:IPC-E741HB0-R4
    • CPU:Intel Xeon Silver 4410T(10C / 20T)×2
    • メモリ:256GB(DDR5 ECC RDIMM)
    • OS:Windows 11 IoT Enterprise LTSC(24H2)日本語版

CrystalDiskMark

Rocket 7608Aに Samsung 9100 PRO 2TBを8枚搭載 して計測を行いました。

Ryzen 環境とは大きく異なるスコア結果となりました。 シーケンシャル性能については、Xeon W 環境 が Ryzen とほぼ同等の結果を示しましたが、Xeon Scalable 環境 ではやや伸び悩む傾向が見られます。 また、ランダムアクセス性能では Ryzen 環境に大きく差をつけられる結果となりました。

アスク様に確認したところ、ドライバの最適化が影響している可能性があるとのことで、現時点ではAMD環境のほうがより安定して高い性能を発揮しているようです。

FastCopy

せっかく Gen5 x16スロットを複数搭載しているXeon環境 ですので、Xeon W環境にて超高速ファイルコピーソフト「FastCopy」を用い、転送速度を測定しました。

皆様もご経験があるかと思いますが、OS標準のファイルコピー機能では転送速度が遅く、大容量ファイルの移動に時間がかかります。

そのため、高速ストレージの性能を十分に活かせず、「宝の持ち腐れ」になってしまうことも少なくありません。

FastCopy は、Windows 環境でのファイルコピーを高速化するために設計された、軽量かつ高機能なユーティリティです。 今回使用したFastCopyは、未リリースのVer.6.0.0 α版です。

本検証にあたり、株式会社アスク様および合同会社FastCopy研究所様の多大なるご協力を賜りましたことを、ここに深く感謝申し上げます。

使用したデータは、3.33GBおよび5.01GBのMOVファイル

これらを複数回コピーし、大容量のフォルダーを生成した上で転送テストを行いました。

構成は以下のとおりです。

  • Rocket 1608A:Samsung 990 PRO 2TB ×8(OSの「ディスクの管理」からストライピング構成)
  • Rocket 7608A:Samsung 9100 PRO 2TB ×8(専用RAID管理ソフトでRAID 0構成)

上記2つの構成間(1608A → 7608A)でファイル転送を実施しました。

リリース版のFastCopyでは、50GB/sを超える転送速度は実現できないとのことです。

そのため、特別にご提供いただいた 開発版(Ver.6.0.0 α版) にて 56GB/s を期待して検証を行いましたが、複数回の試行でも速度は向上せず、結果は「43,011 MB/s(=42.01GB/s)」となりました。

今後は、AMD Ryzen Threadripper(Pro)環境で同様のテストを行い、さらなるスコア向上が見込めるかどうかを検証したいと考えています。

全ストレージ構成の結果一覧と総括

最後に、これまでの各環境の結果を比較しやすいよう、すべての計測結果を一覧表にまとめています

CrystalDiskMark「64GiB」

Blackmagic Disk Speed Test「5G」

私自身、2010年頃に登場したCrucial RealSSD C300を初めて使用した際、HDDよりもベンチマークの数値が大幅に高速で、さらにその結果以上に体感速度の向上を実感したことをよく覚えています。

しかし、こうして改めて比較してみると、SATAインターフェースの転送速度の限界とともに、当時のSSDが次第に取り残されていく様子が見えてきます。

ストレージ性能も、世代を重ねるごとに進化を続けるPCIeインターフェースの高速化に合わせて「追いつけ追い越せ」と着実に向上していることが、一目で分かるのではないでしょうか。

普段の作業では意識する機会の少ないストレージ性能ですが、実際には CPUやメモリではなくストレージがボトルネック となるケースも少なくありません。

そのような場合は、高速ストレージの導入によってボトルネックの解消を試みることをぜひ検討してみてください。

あらためまして、今回の検証にあたり、

株式会社アスク様、ITGマーケティング株式会社様、FastCopy研究所様より多大なるご協力を賜りましたことに、心より深く感謝申し上げます。

産業用コンピュータならHPCシステムズ 

HPCシステムズでは信頼性の高い産業用コンピュータ/タブレットを幅広く提供しています。 

要求仕様に応じたカスタマイズのほか、中小規模での量産にも対応。仕様設計・試作・検証・生産・サポートまで徹底的にお応えいたします。

AMD Ryzen 搭載ワークステーション「WS-GR870PA-T」

WS-GR870PA-T | 産業用コンピュータならHPCシステムズ
動画編集・画像処理・CG・生成AI向けタワー型 ワークステーション

用途にあわせてカスタマイズ可能!
お見積りシミュレーション

HPCシステムズ BTOサイト |