HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

ベンチマーク

HPC

第3世代Xeonスケーラブル・プロセッサーベンチマーク

日本時間2021年4月7日、第3世代 Xeon スケーラブル・プロセッサーがリリースされました。 弊社で行ったベンチマーク報告書をこちらからダウンロードいただけます。 実用アプリケーションでのベンチマークで、前世代に比べて実効性能向上が得られていることを定量的に報告しています。 どうぞご覧ください!
計算化学

MPI or openMP

DFTB+という電子特性を研究する為の量子シミュレーションプログラムがあります。 ごく偶にお問い合わせがある古くからあるアプリです。 色々な事が出来るのですが、研究分野を離れたところで興味深い点がありまして、それは、元々、並列をOpenMPで実装していたという点です。 ver17.1までは、OpenMPだけで実装されていました。 ところが、ver19.1でなんとMPIも実装されたという事で、比較試験を行なってみました。 手頃な計算時間のかかるインプットはないかいなという事で、レシピというサンプルの中の2D carbon armchairのv1 densityを求めるインプット...
GPU

NVIDIA A100 ベンチマーク公開

Nvidia A100 のベンチマーク情報を公開しました。 今回は、CNNだけでなくBERTでもベンチマークしました。下からダウンロードページに飛びます。 今回、アーキテクチャがAmpereへと更新され、性能向上だけでなく、様々な機能が搭載されました。 スペック情報 NVIDIA A100-PCIEと、NVIDIA V100S-PCIEのスペック比較です。 TensorCore、FP16の性能が大きく伸びました。 GPU型番 NVIDIA A100-PCIE NVIDIA Tesla V100S-PCIE アーキテクチャ ...
DL

NVIDIA® V100S vs A100™ Deep Learning Benchmarks

NVIDIA V100S PCIe 32GB とA100™ PCIe 40GB の Deep Learning 学習での性能評価のため、HPC5000-XCLGPU4TS (PCIe Gen3)とHPC5000-ERMGPU8R4S (PCIe Gen4)にGPUを1枚、2枚、3枚、4枚を実装して、nvidia/tensorflow:20.11-tf1-py3を実行してみました。 製品名:HPC5000-XCLGPU4TS CPU Intel(R) Xeon(R) Gold 6242, CPUクロック 2.8 GHz, CPUコア 32, メモリ容量 192GB, 2933 MT/s   ...
計算化学

DALTONを高速化

DALTONという名前の量子化学プログラムスイートがあります。 この名称は、ホームページで人物の姿があるように、John Dalton博士をリスペクトしたものだろうという事は分るのですが、イギリス系の地名や姓など、かなり一般的な単語の為、Web用の検索エンジンを単純に使用すると、関連の無いものばかりが並ぶ事になるという困ったアプリでもあったりします。 このDALTON、かなり古くから存在するもので、最初のリリースは1983年、version 1.0が1997年 というものなので、スパコン世代の癖がかなり濃厚に残っているアプリです。 2011年以降、DALTONはバージョンナンバーがv...
計算化学

AMD Ryzen Threadripper で Gaussian

AMD Ryzen Threadripper はデスクトップPC用途ですが、コアをEPYCと共通化させているため、コア自体の底力は、なかなか期待できるものです。 Gaussian16 Rev. C.01 でいつものtest0397を動かしてみました。使ったCPUは Threadripper 3970X (32core, 3.7GHz) です。 けっこうIntel Xeonと善戦していることがわかります。手ごろな価格でGaussian計算機を探している方には朗報ですね。
HPC

AMD EPYC 7002シリーズ(Rome) ベンチマーク Gaussian

AMD EPYC の最新世代 Rome、7002シリーズプロセッサーについて、ベンチマークを取得しました! ベンチマーク取得したアプリケーションは Gaussian です。 1CPUあたりコア数が最大64、メモリ8チャンネル、AVX2対応、と目を引くスペックですが、これを Xeon Cascade Lake と比べるとどうなるのか!? どうぞご覧ください! ベンチマーク報告書ダウンロードページはこちら
DL

DGX-1 ベンチマークレポート

概要  先日、DGX-1を購入した記事を書きました。今回は、DGX-1を現在の他製品と比較したベンチマークを紹介します。 ハードウェア環境  今回は、DGX-1と、HPC5000-XBWGPU10R4Sに NVIDIA® V100-PCIE(16GB)、RTX2080Tiを搭載して、比較します。ハードウェア環境は下表のとおり。表で分かる通り、RTX2080TiとNVIDIA® V100PCIEは、4枚しか持っていません。 機種 NVIDIA DGX-1 HPC5000-XBWGPU10R4S 搭載GPU NVIDIA® V100-SXM2 RTX2080T...
HPC

ARMでGROMACS

HPCチャレンジを動かして、大まかなARMのcpuの性格が分ったという事で、では、実アプリじゃどうなのか、という話になりました。 OSは共通、さらに、gccやclang、flangが使用可能という事で、ソースがあるlinux上の大抵のアプリはポート出来るとは思いはするものの、やはり、ポーティングされた例が多いものである方が成功する可能性は高いと考えられます。ポーティング例が多く、ソースが付属しているとなると、やはりOpenSouce系のアプリが良いでしょう。という訳で、gromacsをビルドして動かしてみる事にしました。 gromacsを選択する理由として 1、OpenSour...
HPC

第2世代IntelXeonスケーラブルプロセッサベンチマーク:Gaussian

Gaussianは量子化学計算のアプリケーションで、この分野においてデファクトスタンダードとなっています。(公式HP) 2018年4月3日時点での最新版は、Gaussian 16 rev.B01 となります。 今回のベンチマーク環境は以下となります。   第2世代環境 (第2世代インテルXeonスケーラブルプロセッサ) 第1世代環境 (第1世代インテルXeonスケーラブルプロセッサ) CPU Xeon Platinum 8268 x 2 ( 2.9GHz/24Core ) x 2 Xeon Gold  6154 ( 3.0 GHz/18Core ...
HPC

第2世代IntelXeonスケーラブルプロセッサベンチマーク:VASP

VASPは密度汎関数法による平面波・擬ポテンシャル基底を用いた第一原理電子状態計算プログラムパッケージです。(公式HP) 2018年4月3日時点での最新版は、Version 5.4.4 patch1 ( patch.5.4.4.16052018 ) となります。 今回のベンチマーク環境は以下となります。   第2世代環境 (第2世代インテルXeonスケーラブルプロセッサ) 第1世代環境 (第1世代インテルXeonスケーラブルプロセッサ) CPU Xeon Platinum 8268 x 2 ( 2.9GHz/24Core ) x 2 Xeon G...
HPC

第2世代IntelXeonスケーラブルプロセッサベンチマーク:Amber

今回ベンチマークを行うアプリケーションはAmberです。 Amberは生体分子シミュレーション用アプリケーションです。(公式HP) Amber は 有償のSolverと無償のツール群(AmberTools)に分かれており、SolverのビルドにはAmberToolsのビルドも必要になります。 2018年4月3日時点での最新版は、Amber(Solver)、AmberTools 、共にVersion 18となります。 この Amber 18 & AmberTools 18 の組み合わせですが、 インテル🄬 Parallel Studio XE 2018と相性が悪く、ビルド中...
HPC

第2世代IntelXeonスケーラブルプロセッサベンチマーク:HPL

第2世代IntelXeonスケーラブルプロセッサでHPLのベンチマークを行い、第1世代IntelXeonスケーラブルプロセッサと比較した。
HPC

ARMでHPCチャレンジ

ARM64のWSが評価用に入った訳なんですが、 まずは軽いベンチでも行なおうという事で、HPCチャレンジベンチマークをやってみる事にしました。 HPCチャレンジベンチマークは にある7つのベンチマークを行なってスパコンの性能を調査するベンチマークで、京がHPCチャンレンジ賞を取った事とか、古くは地球シミュレーターでMPIFFTでトップに立った話などを聞き及んだ事があるかと思います。 大型クラスター向けのベンチマークなので、1台のマシンで取っても仕方ない面はあったり、STAR◯◯というベンチマーク結果の説明が少なかったり、結果が盛り難いという難点?があったりはするのですが、複数の視点か...
HPC

ARM WSが求められる訳

ARMで動きそうなもの、開発してねという依頼が来ました。 最初、Raspberry Piでも使うのかと吃驚しましたが、そうではなく、ARM64のWSでという事でした。色々、ARMに関しては動きがありますが、 ・アップルが次世代CPUにARMを採用するのではないかという推測が出ているらしい事。 ・マイクロソフトがARMで動くwindowsを開発した事。 ・ARMをソフトバンクが購入した事。 一般的なトピックとしてはこれらが有名かなと思います。 ARMは、組み込みの分野で大きなシェアを持っていますが、一般的な知名度では、スマホのCPUとして知られているかなと思います。 スマホ、携帯電...