HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

HPC

HPC

GRRMチュートリアル2022の参加者を募集しています

弊社でもバージョン20を販売しておりますGRRMについて、基本的な理論や使い方を修得することができるGRRMチュートリアルが今年も量子化学探索研究所主催で開催されます。Zoomを用いたオンライン開催ですので、遠方のお客様も参加しやすい形態となっています。GRRMを使ってみたいけど、使いこなせるか心配、といった方は、とても適したチャンスです! 開催概要やお申込みにつきましては以下をご参照ください。 GRRMチュートリアル2022 (オンライン方式) 2022年度のGRRMチュートリアルが下記の要領で開催されます。  日時: 10月19(水)10:00-16:30  (受付開始: 9:30...
HPC

AMD instinct MI250 ベンチマーク

史上初エクサスケールシステム、Frontier  ISC2022において、発表されたTOP500にて、Frontierが2位の富岳(442.01 PFLOPS)を抜いて、1.102 EFLOPS と、初めて「EFLOPS」の数値を達成して1位となりました。  Frontierは、74台のCray EXキャビネットに9,408ノードを収容し、それぞれにAMD Milan “Trento” 7A53 Epyc CPUを1個とAMD Instinct MI250X GPUを4個搭載して構成されています。総GPU数は 37,632基です。 AMD Instinct MI250  今回は、Fro...
HPC

スーパーコンピュータ「富岳」が四冠を取ったので、HPCGを動かしてみた

なんかこう一昔前の動画サイトの題名みたいな感じですね。 スーパーコンピュータ「富岳」が四冠を連続達成です。四冠というと、棋士の藤井さんの方がインターネットサーチエンジンではヒットしてしまうので、勝負飯のお店で「富岳」なんてお店があったのかなんてまとめサイトに載せられそうにも思ったりしますが、まあ、勝負には違いはないので、将棋と外食メニューよりは近いお話です。 この「富岳」の四冠ですが、Linpack(HPL)はあまりに身近で実際に動かす機会も多いのですが、HPCGというのは何でしょう。 このサイトがHPCGのホームページで、現在の最新バージョンは3.1です。このHPCGには色々な特徴...
HPC

numpyにおけるCPU最適化

IcelakeはRHEL、CentOS や AlmaLinuxなど、RHEL8系からの対応という事で、RHEL8系へのOSの変更といった事例が増えています。RHEL8系ならではの様々な違いなどもありますが、困ってしまうのがpythonの扱いです。RHEL8系はOSの管理用のpythonとユーザー環境用のpythonが分れているなどの違いもありますが、python2のサポート終了に関係して、site-packageを入れたrpmパッケージが少ないなどもあり、OS付属のpython2.7を使用するのは如何なものか、というのが実際のところです。 いやいや、python3を使えばいいじゃないというの...
HPC

ウェビナーへどうぞご参加ください!計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~のご案内

このウェビナーにはFX700や「富岳」などのA64FX環境での技術的な話題もありますので、Tech Blogでも紹介をさせてください。 無料ウェビナー 計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~ 弊社の講演者からは、FX700や「富岳」にて計算化学アプリケーションを安定動作させるため&高速化させるために行った試行錯誤をいくつか報告いたします。 「富岳」をクラウド計算資源として実務に活用していく際にFX700がどのように役に立つかを、わかりやすさを大切にしながら説明いたします。 「富岳」やHPCクラウドにご興味がございましたら、どうぞご参加ください!
HPC

Intel HPC Forum 2021のご案内

Intel HPC Forum 2021が6月23日(水)にオンラインにて開催されます。 弊社はパートナーとして後援しています。ぜひご参加ください。   < 概要 > < アジェンダ > ▶13:00-13:05 「開会の挨拶」 インテル株式会社 技術本部 執行役員常務 技術本部長 土岐英秋 ▶13:05-13:15 「インテル HPC/AI 戦略の革新」 インテル株式会社 ビジネス・デベロップメント・グループ  HPC事業開発マネージャー 矢澤 克巳 ▶13:15-13:35 「最新のインテル® Xeon® スケーラブル・...
HPC

「富岳」でのアプリビルド検証状況

理化学研究所と進めさせていただいている「富岳」のクラウド的利用共同研究プロジェクトの中で、弊社でセットアップ実績のあるアプリケーションの「富岳」でのビルドに取り組んできました。 性能も電力対性能も世界一の「富岳」を使ってみたい、でもA64FX(aarch64)でいつも使っているアプリケーションが問題無く動くのかわからない、という不安もおありなのではと思いますので、生の事実を共有いたします。 量子化学 - Gaussian16 弊社では2020年7月からGaussian社と一緒に報告・検証を進めてきました。紆余曲折ありましたが、今年2月中旬に入手したGaussian社公式バイナリを用い...
HPC

第3世代Xeonスケーラブル・プロセッサーベンチマーク

日本時間2021年4月7日、第3世代 Xeon スケーラブル・プロセッサーがリリースされました。 弊社で行ったベンチマーク報告書をこちらからダウンロードいただけます。 実用アプリケーションでのベンチマークで、前世代に比べて実効性能向上が得られていることを定量的に報告しています。 どうぞご覧ください!
HPC

NVMe over Fabric対応Ingrasys ES2000ベンチマーク結果

NVMe Over Fabricに対応したストレージシステムとしてIngrasys社が提供中の製品 ES2000(製品ページはこちら)のベンチマークを実施しました。その結果を、ご紹介します。 アプリケーションからES2000へのアクセス ES2000をご存じない方にまずご理解いただいたいのが、アプリ―ケーションがES2000内のデータにアクセスするためのユニークな形態です。 アプリケーションは、ネットワークファブリック経由でES2000に収容されたEthernetSSDにアクセスします。その際、OSが、RDMAデータ転送を制御するとともに、キャラクタデバイス、ブロックデバイス...
HPC

MPI or openMP

DFTB+という電子特性を研究する為の量子シミュレーションプログラムがあります。 ごく偶にお問い合わせがある古くからあるアプリです。 色々な事が出来るのですが、研究分野を離れたところで興味深い点がありまして、それは、元々、並列をOpenMPで実装していたという点です。 ver17.1までは、OpenMPだけで実装されていました。 ところが、ver19.1でなんとMPIも実装されたという事で、比較試験を行なってみました。 手頃な計算時間のかかるインプットはないかいなという事で、レシピというサンプルの中の2D carbon armchairのv1 densityを求めるインプット...
HPC

EBOF検証はじめました2

図は、EBOFとその上位サーバから構成されるEBOFシステムのアーキテクチャ概要です。本システムは、NVMeOF,RDMA,RoCEv2を組み合わせて実現しています。 ・NVMeOF(NVMe over Fabric)が、Fabric経由で接続されるNVMeデバイスにブロックデバイスインタフェースを提供します。 ・RDMAが、PCIe経由のIOをCPUからオフロードする処理を担当します。 ・RoCEv2(RDMA over Converged Ethernet v2)が、PCIeデータをUDPで梱包し、イーサネット経由でEBOF側SSDに転送する処理を担当します。 これにより、本シ...
HPC

EBOF検証はじめました

最近、ストレージに関して、お悩みありませんか? このままハードディスクを使い続けようか?それとも、価格と性能が遜色なくなりつつあるSSDをもっと活用してみようか?と、思っていらっしゃいませんか?そんなあなたに、弊社で最近、検証を始めたストレージ装置を紹介させてください。 近年、Deep Learningなどの領域では、処理対象データが指数的に増加する一方、SSD技術の進展により、HPC/AI市場におけるストレージ装置の位置づけが変化しています。 お客様は、処理対象データのプレ・ポスト処理の生産性向上やスケーラビリティなどを確保するため、広帯域、大容量、低遅延なIOパフォーマンスを実現す...
HPC

VASP:事前/事後処理に使うソフトウェアの紹介

はじめに この記事では、GUI上で操作できる無償のものを中心に、VASPの事前・事後処理を行うソフトウェアを紹介します。 入力ファイルを入手する VASPで計算を行うためには以下4つの入力ファイルを用意する必要があります。 POSCAR 対象となる物質の結晶構造データ POTCAR 物質中の各原子の擬ポテンシャルデータ INCAR 計算方法などの設定 KPOINTS 計算するk点の設定 初めて利用される方がこれらのファイルをいきなり自作するのは大変です。そこでまずは, 以下のデータベースから目的の物質を探し、入力ファイルを入手する...
HPC

VASP:結果の可視化について

はじめに VASPは密度汎関数理論(Density Functional Theory: DFT)に基づいて電子状態を計算するソフトウェアです。擬ポテンシャル法を採用しており、全電子計算を行うWIEN2kなどのソフトウェアに比べて高速に計算できます。また、精度に関しても良い成績を残しており、様々な分野で広く使われています。 しかし一方で、VASPの出力形式は状態密度(Density of state: DOS)・バンド分散・フェルミ面などの基本的な解析結果を可視化しづらく、計算実行後に出力ファイルを編集する手間が必要です。この点はQuantum ESPRESSOの方がユーザーフレンドリーな...
HPC

DALTONを高速化

DALTONという名前の量子化学プログラムスイートがあります。 この名称は、ホームページで人物の姿があるように、John Dalton博士をリスペクトしたものだろうという事は分るのですが、イギリス系の地名や姓など、かなり一般的な単語の為、Web用の検索エンジンを単純に使用すると、関連の無いものばかりが並ぶ事になるという困ったアプリでもあったりします。 このDALTON、かなり古くから存在するもので、最初のリリースは1983年、version 1.0が1997年 というものなので、スパコン世代の癖がかなり濃厚に残っているアプリです。 2011年以降、DALTONはバージョンナンバーがv...
HPC

AMD Ryzen Threadripper で Gaussian

AMD Ryzen Threadripper はデスクトップPC用途ですが、コアをEPYCと共通化させているため、コア自体の底力は、なかなか期待できるものです。 Gaussian16 Rev. C.01 でいつものtest0397を動かしてみました。使ったCPUは Threadripper 3970X (32core, 3.7GHz) です。 けっこうIntel Xeonと善戦していることがわかります。手ごろな価格でGaussian計算機を探している方には朗報ですね。
HPC

EPYC ROME環境におけるMKL環境変数の影響について その2

前回のブログの通り、実際にアプリケーションの動作を確認していきます。 今回検証に使用したハードウェア環境、開発環境は以下の1ノードとなります。 HW構成 :CPU                  AMD EPYC 7702 ( 2.0GHz / 64core ) x 2        Memory              256 GB ( 16 GB 3200 MT/s x 16 ) OS         :CentOS 7.6 Compiler:Intel Compiler 19.0.5.281、17.0.7.259 MKL   : 上記 Intel Compiler に同梱...
HPC

EPYC ROME環境におけるMKL環境変数の影響について その1

お久しぶりです。 随分間が空いてしまいました、申し訳ありません。 EPYC ROME環境での計算科学アプリケーションの挙動について、引き続き書いていこうと思います。 ソースコードで配布されている科学技術計算用アプリケーションにおいては、想定している開発環境として、数値計算ライブラリ Intel Math Kernel Library ( MKL )に対応しているものが複数あります。 弊社ではこのようなアプリケーションでMKLを使用したビルドを行っています。 これは、Intel製CPU環境においては、MKLが性能的に優れ、動作的にも安定しているためです。 しかし、EPYC環境において...
HPC

M6g 触ってみた (2) -OpenFOAM ベンチマーク結果-

はじめに 前回の記事でAWS EC2 M6gインスタンスに使われているGraviton2についての簡単な紹介と、HPLベンチマークの結果を掲載しました。今回はOpenFOAMについてのベンチマーク結果をご紹介します。実のところA1インスタンスの登場時にも同様の検証を行っていましたが、当時はこのブログもなかったので、私が参加した勉強会などのLT等で紹介するにとどまりました。 ベンチマーク内容 これも前回触れましたが、OpenFOAM-v1912をUbuntu20.04LTS標準のgcc-9.3.0, OpenMPI-4.0.3でビルドしました。ベンチマークデータは弊社も賛助会員のオープンC...
HPC

M6g 触ってみた (1) ーARM64の広がる世界ー

はじめに SARS-CoV-2対策のため、未だ未完成の富岳の起動が発表されたことに、オタク心をくすぐられた方も多いのではないかと思います。富岳はCPUがARMベースであることも知られており、1CPUあたり48コアにおよぶ計算用コアはHPCに必要な演算性能を生み出しますが、カタログ上の最大演算性能は内蔵されているSVEと呼ばれるベクトル演算ユニットに依るところが大きいと思われます。ARMはCPUが持つべき基本機能を備えた設計のみをライセンス販売していて、開発者はそれをたたき台にアレンジしたり、SVEのような付加機能を付け足したりすることで、実際のCPUを設計・製造します。これによりCPU全体や...