HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

ベンチマーク

DL

NVIDIA GH200 MLベンチマーク公開

NVIDIA GH200 の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、NVIDIA H100-PCIEと A6000 を加えた計3種のGPUで、機械学習の学習性能を比較評価しています。 ベンチマーク報告書のダウンロードはこちら >> スペック情報 NVIDIA GH200、NVIDIA H100-PCIE、NVIDIA A6000 のスペック比較表は次のとおりです。 GPU型番 NVIDIA GH200 NVIDIA H100-PCIE NVIDIA A6000 アーキテクチャ Hopper Hopper Amper...
DL

NVIDIA A800 MLベンチマーク公開

NVIDIA A800(40GB Active) の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、NVIDIA A100 を加えた計2種のGPUで、機械学習の学習性能を比較評価しています。 ベンチマーク報告書のダウンロードはこちら >> スペック情報 NVIDIA A800、NVIDIA A100 のスペック比較表は次のとおりです。 GPU型番 NVIDIA A800 40GB Active NVIDIA A100 80GB PCIe アーキテクチャ Ampere Ampe...
HPC

SLC採用、高速NVMe™ SSD KIOXIA FL6 レビュー

はじめに 今回、KIOXIA社が横浜に開設したKIOXIA Innovation Labを利用して、SLC(Single Level Cell)を採用した高速NVMe™ SSD、FL6をリモート評価させていただく機会をいただきました。 KIOXIA Innovation Labとは KIOXIA Innovation Labは、KIOXIA社が提供するクラウド型のKIOXIA製品PoC施設です。KIOXIA社の最新SSDや関連技術、ソフトウエアを評価できる環境を利用することが可能です。リモートからVPN接続しWebブラウザだけで利用可能でした。 K...
DL

RTX A5500、RTX 5000 Ada MLベンチマーク公開

NVIDIA RTX A5500 と RTX 5000 Ada の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、これらのGPUに NVIDIA A6000 と RTX 4090 を加えた計4種のGPUで、機械学習の学習性能を比較評価しています。 スペック情報 NVIDIA RTX A5500、RTX 5000 Ada、RTX A6000、GeForce RTX 4090 のスペック比較表は次のとおりです。青文字は資料などからの推測値です。 GPU型番 NVIDIA RTX A5500 NVIDIA RTX 5000 Ada ...
DL

NVIDIA L40S MLベンチマーク公開

NVIDIA L40S の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、NVIDIA A100 を加えた計2種のGPUで、機械学習の学習性能を比較評価しています。 ベンチマーク報告書のダウンロードはこちら >> スペック情報 NVIDIA L40S、NVIDIA A100 のスペック比較表は次のとおりです。青文字は資料などからの推測値です。 GPU型番 NVIDIA L40S NVIDIA A100 アーキテクチャ Ada Lovelace Ampere ...
HPC

第4世代 AMD EPYC 97X4 プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年6月13日、新コアを採用した第4世代 AMD EPYC™ 97X4 プロセッサー(開発コード名:Bergamo)がリリースされました。開発コード名Genoaの第4世代 AMD EPYC™ プロセッサーと比べると、論理的には「Zen 4」と同じながら物理設計を変更してCPUコアのエリアサイズが縮小されている、従来の4MB/コアから2MB/コアに3次キャッシュが縮小されている、1つのダイに2つのCCXが搭載されそれらがIoD経由で通信される、といった差異があります。この新プロセッサーは元々クラウドのワークロード向け...
CTO

第11世代CPU(Z590)&第12世代CPU(Z690)のCPU性能テスト/比較

第12世代Coreプロセッサーについて   第12世代 第11世代 コア構成 高性能コア+高効率コア 高効率コアのみ(Core i5 Kなし以下) 高性能コアのみ コア/スレッド(最大) Core i9 : 16コア/24スレッド Core i7 : 12コア/20スレッド Core i5 K : 10コア/16スレッド Core i5(Kなし) : 6コア/12スレッド Core i3 : 4コア/8スレッド Core i9 : 8コア/16スレッド Core i7 : 8コ...
計算化学

VASP 6.4.1 : libxcの使用

VASP 6.4.1がリリースされました。実はvasp 6.3.0からlibxcが使用可能なのですが、vasp 6.4.1に最新のlibxc 6.1.0を組み込んで、libxcを使用した場合、実行時間が早くなるかを試験しました。 libxcに関しては、 をご参照下さい。 使い方は簡単で、インプット(INCAR)で GGA=PA としている部分を GGA = LIBXC LIBXC1 = GGA_X_PBE LIBXC2 = GGA_C_PBE と変更するだけで、VASPビルド時にlibxcが組み込んであれば、VASPの内部でlibxcが呼ばれて使用されます。VASPでの使い方等...
HPC

第4世代 インテル Xeon スケーラブル・プロセッサー ベンチマーク

※2023年5月17日に改めて公開いたしました。 ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年1月10日(日本時間11日)、第4世代 インテル🄬 Xeon🄬 スケーラブル・プロセッサー(開発コード名:Sapphire Rapids)がリリースされました。「Intel 7」製造プロセスにより微細化され、1ソケットに最大56コアを搭載可能になったことに加え、CPU間のUPI接続がCPUあたり最大4本に増加し、その速度が16 GT/sに向上しました。また、新たにDDR5-4800のメモリに対応して、より太いメモリ帯域に進化しました。さらに、データ移動のための...
計算化学

VASP 6.4.1 : on the fly 機械学習力場

vasp 6.4.1がリリースされましたが、このバージョンで特に強化されているのが、機械学習力場の機能部分です。この機械学習力場を上手く活用すると、大変な計算時間の短縮になるので紹介します。 機械学習力場というと、「力場で計算した結果は信用出来ない」とか、「機械学習ならGPUが必要でしょ?高価なGPUは購入予定が無いので。」といった事を思われるかもしれません。力場の使用に関しては、自分が計算したい系を扱った力場で適切なものを選択するのが大変で、その選定や差異などをチェックするところでとても手間と計算リソースを消費する為、力場で計算する事で省力化可能より手間が大きくなりそうに思えるという事はあ...
DL

NVIDIA H100, GeForce RTX 4090 MLベンチマーク公開

NVIDIA H100 と GeForce RTX 4090 の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、これらのGPUに NVIDIA A100 と RTX 3090 を加えた計4種のGPUで、機械学習の学習性能を比較評価しています。 スペック情報 NVIDIA H100 PCIe、NVIDIA A100 PCIe、GeForce RTX 4090、GeForce RTX 3090 のスペック比較表は次のとおりです。CUDAコア数とGPU Boost時クロックが向上していることがわかります。 GPU型番 NVIDIA H100-PCI...
計算化学

第4世代 AMD EPYC プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2022年11月10日、第4世代 AMD EPYC™ プロセッサー(開発コード名:Genoa)がリリースされました。新マイクロアーキテクチャ「Zen 4」を採用し、5nm製造プロセスにより微細化されて、1ソケットで最大96コア、2ソケットで最大192コアという多コア構成が可能になったことに加え、DDR5-4800メモリに対応してメモリチャンネルが12本に増えたことでメモリ帯域も太く構成されている点が特長です。また、AVX-512命令に対応してAI・HPCワークロード向けに機能強化された他、キャッシュ階層と分岐予測の改善に...
計算化学

Core i9-12900KでのGaussianベンチマーク

第12世代インテル® Core™ i9プロセッサーの12900Kは、Performance-core(P-core)を8個・Efficient-core(E-core)を8個搭載したデスクトップPC向けハイエンドプロセッサーです。実計算における性能を明らかにするため、量子化学計算のデファクトスタンダードであるGaussian16にてベンチマークを行いました。 ベンチマーク環境 サーバー: HPC2000-CAL104TA CPU: Intel® Core™ i9-12900K メモリ: 32GB DDR5-4800 ECC UDIMM x2 ソフトウェア: Windows 11 ...
DL

Geforce RTX4090 ベンチマーク

Ada Lovelace アーキテクチャ  Geforce RTX 4090は、新型GPUアーキテクチャ「Ada Lovelace」を採用する初めてのGPUです。製造プロセスが4nmになり微細化が進み、GPUコア数、周波数が劇的に伸びました。また、Tensorコアは第4世代となり、FP8演算エンジンも搭載されました。 RTX4090スペック 今回、比較したGeforce RTX3090と、Geforce RTX4090のスペックを下表にまとめました。   Geforce RTX 4090 Geforce RTX 3090 アーキテクチャ Ada Lovela...
HPC

インテル12900Kの理論性能について

図1 第12世代インテル® Core™ i9 プロセッサー12900K 現在、第12世代インテル® Core™ i9 プロセッサー12900Kを搭載した当社ワークステーション の評価を行っています。 このCPUは、最大 8 個の高性能コア (P コア) と最大 8 個の高効率コア (E コア) からなるハイブリッド・アーキテクチャーを採用しています。インテル® スレッド・ディレクターが、Pコア/Eコアをワークロードへ適切に割り当てるということですが、そもそもの理論性能は?と思って調べました。が、どこにも見当たりません。 そこで自分で計算してみました。 表 周波数は、P...
HPC

スーパーコンピュータ「富岳」が四冠を取ったので、HPCGを動かしてみた

なんかこう一昔前の動画サイトの題名みたいな感じですね。 スーパーコンピュータ「富岳」が四冠を連続達成です。四冠というと、棋士の藤井さんの方がインターネットサーチエンジンではヒットしてしまうので、勝負飯のお店で「富岳」なんてお店があったのかなんてまとめサイトに載せられそうにも思ったりしますが、まあ、勝負には違いはないので、将棋と外食メニューよりは近いお話です。 この「富岳」の四冠ですが、Linpack(HPL)はあまりに身近で実際に動かす機会も多いのですが、HPCGというのは何でしょう。 このサイトがHPCGのホームページで、現在の最新バージョンは3.1です。このHPCGには色々な特徴...
HPC

第3世代Xeonスケーラブル・プロセッサーベンチマーク

日本時間2021年4月7日、第3世代 Xeon スケーラブル・プロセッサーがリリースされました。 弊社で行ったベンチマーク報告書をこちらからダウンロードいただけます。 実用アプリケーションでのベンチマークで、前世代に比べて実効性能向上が得られていることを定量的に報告しています。 どうぞご覧ください!
計算化学

MPI or openMP

DFTB+という電子特性を研究する為の量子シミュレーションプログラムがあります。 ごく偶にお問い合わせがある古くからあるアプリです。 色々な事が出来るのですが、研究分野を離れたところで興味深い点がありまして、それは、元々、並列をOpenMPで実装していたという点です。 ver17.1までは、OpenMPだけで実装されていました。 ところが、ver19.1でなんとMPIも実装されたという事で、比較試験を行なってみました。 手頃な計算時間のかかるインプットはないかいなという事で、レシピというサンプルの中の2D carbon armchairのv1 densityを求めるインプット...
DL

NVIDIA A100 ベンチマーク公開

Nvidia A100 のベンチマーク情報を公開しました。 今回は、CNNだけでなくBERTでもベンチマークしました。下からダウンロードページに飛びます。 今回、アーキテクチャがAmpereへと更新され、性能向上だけでなく、様々な機能が搭載されました。 スペック情報 NVIDIA A100-PCIEと、NVIDIA V100S-PCIEのスペック比較です。 TensorCore、FP16の性能が大きく伸びました。 GPU型番 NVIDIA A100-PCIE NVIDIA Tesla V100S-PCIE アーキテクチャ ...
DL

NVIDIA® V100S vs A100™ Deep Learning Benchmarks

NVIDIA V100S PCIe 32GB とA100™ PCIe 40GB の Deep Learning 学習での性能評価のため、HPC5000-XCLGPU4TS (PCIe Gen3)とHPC5000-ERMGPU8R4S (PCIe Gen4)にGPUを1枚、2枚、3枚、4枚を実装して、nvidia/tensorflow:20.11-tf1-py3を実行してみました。 製品名:HPC5000-XCLGPU4TS CPU Intel(R) Xeon(R) Gold 6242, CPUクロック 2.8 GHz, CPUコア 32, メモリ容量 192GB, 2933 MT/s   ...