HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

HPC

計算化学

マシンに最適な Gaussian16 をインストールする手順

はじめに 以下では、Gaussian16 の Unix 向けバイナリ版のインストール手順を解説しています。 単に標準的な手順を知りたいだけであればGaussian社公式のインストール手順を読めば事足りるのですが、大学様の計算機センターなどで複数のバイナリをお持ちの場合に、お使いの計算機に適したバイナリを特定する方法や、そこで間違った際のエラーなど、補足情報も以下に記載しています。 計算機の性能を最大限に引き出すロジックを身に着けていただいて、ご業務の時短に活かしていただければ幸いです。 全体的に Gaussianのインストールにあたっては、Gaussian社の公式サイトにある Ins...
計算化学

VASP 6.4.1 : libxcの使用

VASP 6.4.1がリリースされました。実はvasp 6.3.0からlibxcが使用可能なのですが、vasp 6.4.1に最新のlibxc 6.1.0を組み込んで、libxcを使用した場合、実行時間が早くなるかを試験しました。 libxcに関しては、 をご参照下さい。 使い方は簡単で、インプット(INCAR)で GGA=PA としている部分を GGA = LIBXC LIBXC1 = GGA_X_PBE LIBXC2 = GGA_C_PBE と変更するだけで、VASPビルド時にlibxcが組み込んであれば、VASPの内部でlibxcが呼ばれて使用されます。VASPでの使い方等...
HPC

第4世代 インテル Xeon スケーラブル・プロセッサー ベンチマーク

※2023年5月17日に改めて公開いたしました。 ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年1月10日(日本時間11日)、第4世代 インテル🄬 Xeon🄬 スケーラブル・プロセッサー(開発コード名:Sapphire Rapids)がリリースされました。「Intel 7」製造プロセスにより微細化され、1ソケットに最大56コアを搭載可能になったことに加え、CPU間のUPI接続がCPUあたり最大4本に増加し、その速度が16 GT/sに向上しました。また、新たにDDR5-4800のメモリに対応して、より太いメモリ帯域に進化しました。さらに、データ移動のための...
計算化学

VASP 6.4.1 : on the fly 機械学習力場

vasp 6.4.1がリリースされましたが、このバージョンで特に強化されているのが、機械学習力場の機能部分です。この機械学習力場を上手く活用すると、大変な計算時間の短縮になるので紹介します。 機械学習力場というと、「力場で計算した結果は信用出来ない」とか、「機械学習ならGPUが必要でしょ?高価なGPUは購入予定が無いので。」といった事を思われるかもしれません。力場の使用に関しては、自分が計算したい系を扱った力場で適切なものを選択するのが大変で、その選定や差異などをチェックするところでとても手間と計算リソースを消費する為、力場で計算する事で省力化可能より手間が大きくなりそうに思えるという事はあ...
HPC

RockportNetworks Durham Universityの導入事例の抄訳

この記事は、RockportNetworks社のBlogで紹介されているDurham University Explores a Better Way to Chart the Cosmosの抄訳です。
HPC

RockportNetworks McMaster Universityの導入事例の抄訳

この記事は、RockportNetworks社のBlogで紹介されているMcMaster University Unlocks the Mysteries of Fractureの抄訳です。 12ノードクラスタで適切なスケールで最高のパフォーマンスを提供します。 破壊解析は、橋梁や原子力発電所の亀裂の発生時期や発生場所の予測、水圧破砕やガラス切断などの工業プロセスの改善など、さまざまな分野で幅広く応用されています。 オンタリオ州ハミルトンにあるマクマスター大学の数学・統計学教授でカナダ研究主任のBlaise Bourdin博士は、20年にわたり、破壊のメカニズムと設計をよりよく理...
計算化学

第4世代 AMD EPYC プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2022年11月10日、第4世代 AMD EPYC™ プロセッサー(開発コード名:Genoa)がリリースされました。新マイクロアーキテクチャ「Zen 4」を採用し、5nm製造プロセスにより微細化されて、1ソケットで最大96コア、2ソケットで最大192コアという多コア構成が可能になったことに加え、DDR5-4800メモリに対応してメモリチャンネルが12本に増えたことでメモリ帯域も太く構成されている点が特長です。また、AVX-512命令に対応してAI・HPCワークロード向けに機能強化された他、キャッシュ階層と分岐予測の改善に...
計算化学

Core i9-12900KでのGaussianベンチマーク

第12世代インテル® Core™ i9プロセッサーの12900Kは、Performance-core(P-core)を8個・Efficient-core(E-core)を8個搭載したデスクトップPC向けハイエンドプロセッサーです。実計算における性能を明らかにするため、量子化学計算のデファクトスタンダードであるGaussian16にてベンチマークを行いました。 ベンチマーク環境 サーバー: HPC2000-CAL104TA CPU: Intel® Core™ i9-12900K メモリ: 32GB DDR5-4800 ECC UDIMM x2 ソフトウェア: Windows 11 ...
計算化学

LAMMPS 23Jun2022 update1に関して

LAMMPS 概説 LAMMPSは、Large-scale Atomic/Molecular Massively Parallel Simulatorの略で、材料モデリングに重点を置いた古典的な分子動力学シミュレーションです。 元々はF77で書かれていました。LAMMPS 99がF77で、LAMMPS 2001がF90で書かれていたバージョンです。とあるMPIの実装実験の時、手頃な負荷のアプリが欲しいという事で、C++に書き換えられました。現在のLAMMPSは、2005年に公開されたC++版を祖とするものです。 オープンソースでフリーである事から、特にスパコンで様々な実装実験などに使われ...
HPC

インテル12900Kの理論性能について

図1 第12世代インテル® Core™ i9 プロセッサー12900K 現在、第12世代インテル® Core™ i9 プロセッサー12900Kを搭載した当社ワークステーション の評価を行っています。 このCPUは、最大 8 個の高性能コア (P コア) と最大 8 個の高効率コア (E コア) からなるハイブリッド・アーキテクチャーを採用しています。インテル® スレッド・ディレクターが、Pコア/Eコアをワークロードへ適切に割り当てるということですが、そもそもの理論性能は?と思って調べました。が、どこにも見当たりません。 そこで自分で計算してみました。 表 周波数は、P...
HPC

RoCE対応スイッチベンチマークテスト

今回、RoCE対応スイッチと、実用アプリケーションであるVASPとAmberでベンチマークを取得しました。RoCE環境でInfiniBand-EDR環境に匹敵する性能が得られています。 RoCE環境では、InfiniBand-EDR環境と異なり、ドライバーソフトやMPIのバージョン変更が必要になりますが、リードタイムなどのメリットを勘案すると、注目に値する選択肢と考えられます。   VASPベンチマーク結果 VASPはプロセス間通信が頻発するアプリケーションです。今回は、VASP 5.4.4p1 1,000 atoms (PAW GGA)を使用し、RoCE環境の計算時間比を取得し、In...
計算化学

GRRMチュートリアル2022の参加者を募集しています

弊社でもバージョン20を販売しておりますGRRMについて、基本的な理論や使い方を修得することができるGRRMチュートリアルが今年も量子化学探索研究所主催で開催されます。Zoomを用いたオンライン開催ですので、遠方のお客様も参加しやすい形態となっています。GRRMを使ってみたいけど、使いこなせるか心配、といった方は、とても適したチャンスです! 開催概要やお申込みにつきましては以下をご参照ください。 GRRMチュートリアル2022 (オンライン方式) 2022年度のGRRMチュートリアルが下記の要領で開催されます。  日時: 10月19(水)10:00-16:30  (受付開始: 9:30...
DL

AMD instinct MI250 ベンチマーク

史上初エクサスケールシステム、Frontier  ISC2022において、発表されたTOP500にて、Frontierが2位の富岳(442.01 PFLOPS)を抜いて、1.102 EFLOPS と、初めて「EFLOPS」の数値を達成して1位となりました。  Frontierは、74台のCray EXキャビネットに9,408ノードを収容し、それぞれにAMD Milan “Trento” 7A53 Epyc CPUを1個とAMD Instinct MI250X GPUを4個搭載して構成されています。総GPU数は 37,632基です。 AMD Instinct MI250  今回は、Fro...
HPC

スーパーコンピュータ「富岳」が四冠を取ったので、HPCGを動かしてみた

なんかこう一昔前の動画サイトの題名みたいな感じですね。 スーパーコンピュータ「富岳」が四冠を連続達成です。四冠というと、棋士の藤井さんの方がインターネットサーチエンジンではヒットしてしまうので、勝負飯のお店で「富岳」なんてお店があったのかなんてまとめサイトに載せられそうにも思ったりしますが、まあ、勝負には違いはないので、将棋と外食メニューよりは近いお話です。 この「富岳」の四冠ですが、Linpack(HPL)はあまりに身近で実際に動かす機会も多いのですが、HPCGというのは何でしょう。 このサイトがHPCGのホームページで、現在の最新バージョンは3.1です。このHPCGには色々な特徴...
HPC

numpyにおけるCPU最適化

IcelakeはRHEL、CentOS や AlmaLinuxなど、RHEL8系からの対応という事で、RHEL8系へのOSの変更といった事例が増えています。RHEL8系ならではの様々な違いなどもありますが、困ってしまうのがpythonの扱いです。RHEL8系はOSの管理用のpythonとユーザー環境用のpythonが分れているなどの違いもありますが、python2のサポート終了に関係して、site-packageを入れたrpmパッケージが少ないなどもあり、OS付属のpython2.7を使用するのは如何なものか、というのが実際のところです。 いやいや、python3を使えばいいじゃないというの...
HPC

ウェビナーへどうぞご参加ください!計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~のご案内

このウェビナーにはFX700や「富岳」などのA64FX環境での技術的な話題もありますので、Tech Blogでも紹介をさせてください。 無料ウェビナー 計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~ 弊社の講演者からは、FX700や「富岳」にて計算化学アプリケーションを安定動作させるため&高速化させるために行った試行錯誤をいくつか報告いたします。 「富岳」をクラウド計算資源として実務に活用していく際にFX700がどのように役に立つかを、わかりやすさを大切にしながら説明いたします。 「富岳」やHPCクラウドにご興味がございましたら、どうぞご参加ください!
HPC

Intel HPC Forum 2021のご案内

Intel HPC Forum 2021が6月23日(水)にオンラインにて開催されます。 弊社はパートナーとして後援しています。ぜひご参加ください。   < 概要 > < アジェンダ > ▶13:00-13:05 「開会の挨拶」 インテル株式会社 技術本部 執行役員常務 技術本部長 土岐英秋 ▶13:05-13:15 「インテル HPC/AI 戦略の革新」 インテル株式会社 ビジネス・デベロップメント・グループ  HPC事業開発マネージャー 矢澤 克巳 ▶13:15-13:35 「最新のインテル® Xeon® スケーラブル・...
HPC

「富岳」でのアプリビルド検証状況

理化学研究所と進めさせていただいている「富岳」のクラウド的利用共同研究プロジェクトの中で、弊社でセットアップ実績のあるアプリケーションの「富岳」でのビルドに取り組んできました。 性能も電力対性能も世界一の「富岳」を使ってみたい、でもA64FX(aarch64)でいつも使っているアプリケーションが問題無く動くのかわからない、という不安もおありなのではと思いますので、生の事実を共有いたします。 量子化学 - Gaussian16 弊社では2020年7月からGaussian社と一緒に報告・検証を進めてきました。紆余曲折ありましたが、今年2月中旬に入手したGaussian社公式バイナリを用い...
HPC

第3世代Xeonスケーラブル・プロセッサーベンチマーク

日本時間2021年4月7日、第3世代 Xeon スケーラブル・プロセッサーがリリースされました。 弊社で行ったベンチマーク報告書をこちらからダウンロードいただけます。 実用アプリケーションでのベンチマークで、前世代に比べて実効性能向上が得られていることを定量的に報告しています。 どうぞご覧ください!
計算化学

MPI or openMP

DFTB+という電子特性を研究する為の量子シミュレーションプログラムがあります。 ごく偶にお問い合わせがある古くからあるアプリです。 色々な事が出来るのですが、研究分野を離れたところで興味深い点がありまして、それは、元々、並列をOpenMPで実装していたという点です。 ver17.1までは、OpenMPだけで実装されていました。 ところが、ver19.1でなんとMPIも実装されたという事で、比較試験を行なってみました。 手頃な計算時間のかかるインプットはないかいなという事で、レシピというサンプルの中の2D carbon armchairのv1 densityを求めるインプット...