HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

HPC

さようならicc、こんにちはicx

Intel社というと、世間一般ではCPUを中心としたハードウェアメーカーという印象が強いと思います。ですが Intel社には、CompilerやMPIといった、アプリケーション開発用ソフトウェアを提供している一面もあります。 科学技術用計算アプリケーションにおいて、最近はpython言語を用いて作成されたソースコードも増えましたが、C/C++言語やFortran言語で作成されている物はまだまだ非常に多い状況です。 この C/C++言語やFortran言語で書かれたソースコードをCompileする際、Intel社の提供している C/C++/Fortran用コンパイラ( Intel Compi...
HPC

VASP 6.4.1:i-PIを用いて経路積分分子動力学

LAMMPSユーザーの場合は、古くからtoolsに含まれているのでi-PIをご存じの方は多いと思いますが、VASPのユーザーの場合、知らないという方も多いかと思います。 i-PI は、Python で書かれたab initio 経路積分分子動力学(PIMD)の Python インターフェイスです。原子間の相互作用の ab-initio、機械学習、または力場ベースの評価と併用するように設計されています。イオンの位置の問題と、原子間力を計算する問題を切り離すという目的の為に開発されました。i-PI がサーバーとして機能し、位置エネルギー、力、および圧力ビルアルの位置エネルギー部分の計算はi-...
HPC

マシンに最適な Gaussian16 をインストールする手順

はじめに 以下では、Gaussian16 の Unix 向けバイナリ版のインストール手順を解説しています。 単に標準的な手順を知りたいだけであればGaussian社公式のインストール手順を読めば事足りるのですが、大学様の計算機センターなどで複数のバイナリをお持ちの場合に、お使いの計算機に適したバイナリを特定する方法や、そこで間違った際のエラーなど、補足情報も以下に記載しています。 計算機の性能を最大限に引き出すロジックを身に着けていただいて、ご業務の時短に活かしていただければ幸いです。 全体的に Gaussianのインストールにあたっては、Gaussian社の公式サイトにある Ins...
HPC

VASP 6.4.1 : libxcの使用

VASP 6.4.1がリリースされました。実はvasp 6.3.0からlibxcが使用可能なのですが、vasp 6.4.1に最新のlibxc 6.1.0を組み込んで、libxcを使用した場合、実行時間が早くなるかを試験しました。 libxcに関しては、 をご参照下さい。 使い方は簡単で、インプット(INCAR)で GGA=PA としている部分を GGA = LIBXC LIBXC1 = GGA_X_PBE LIBXC2 = GGA_C_PBE と変更するだけで、VASPビルド時にlibxcが組み込んであれば、VASPの内部でlibxcが呼ばれて使用されます。VASPでの使い方等...
DL

サイバーエージェント社の日本語大規模言語モデルを動かしてみた

サイバーエージェント社の日本語大規模言語モデルをDGX-1(DGX-OS6)で動かしてみた。
HPC

第4世代 インテル Xeon スケーラブル・プロセッサー ベンチマーク

※2023年5月17日に改めて公開いたしました。 ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年1月10日(日本時間11日)、第4世代 インテル🄬 Xeon🄬 スケーラブル・プロセッサー(開発コード名:Sapphire Rapids)がリリースされました。「Intel 7」製造プロセスにより微細化され、1ソケットに最大56コアを搭載可能になったことに加え、CPU間のUPI接続がCPUあたり最大4本に増加し、その速度が16 GT/sに向上しました。また、新たにDDR5-4800のメモリに対応して、より太いメモリ帯域に進化しました。さらに、データ移動のための...
HPC

VASP 6.4.1 : on the fly 機械学習力場

vasp 6.4.1がリリースされましたが、このバージョンで特に強化されているのが、機械学習力場の機能部分です。この機械学習力場を上手く活用すると、大変な計算時間の短縮になるので紹介します。 機械学習力場というと、「力場で計算した結果は信用出来ない」とか、「機械学習ならGPUが必要でしょ?高価なGPUは購入予定が無いので。」といった事を思われるかもしれません。力場の使用に関しては、自分が計算したい系を扱った力場で適切なものを選択するのが大変で、その選定や差異などをチェックするところでとても手間と計算リソースを消費する為、力場で計算する事で省力化可能より手間が大きくなりそうに思えるという事はあ...
HPC

RockportNetworks Durham Universityの導入事例の抄訳

この記事は、RockportNetworks社のBlogで紹介されているDurham University Explores a Better Way to Chart the Cosmosの抄訳です。
HPC

RockportNetworks McMaster Universityの導入事例の抄訳

この記事は、RockportNetworks社のBlogで紹介されているMcMaster University Unlocks the Mysteries of Fractureの抄訳です。 12ノードクラスタで適切なスケールで最高のパフォーマンスを提供します。 破壊解析は、橋梁や原子力発電所の亀裂の発生時期や発生場所の予測、水圧破砕やガラス切断などの工業プロセスの改善など、さまざまな分野で幅広く応用されています。 オンタリオ州ハミルトンにあるマクマスター大学の数学・統計学教授でカナダ研究主任のBlaise Bourdin博士は、20年にわたり、破壊のメカニズムと設計をよりよく理...
DL

NVIDIA H100, GeForce RTX 4090 MLベンチマーク公開

NVIDIA H100 と GeForce RTX 4090 の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、これらのGPUに NVIDIA A100 と RTX 3090 を加えた計4種のGPUで、機械学習の学習性能を比較評価しています。 スペック情報 NVIDIA H100 PCIe、NVIDIA A100 PCIe、GeForce RTX 4090、GeForce RTX 3090 のスペック比較表は次のとおりです。CUDAコア数とGPU Boost時クロックが向上していることがわかります。 GPU型番 NVIDIA H100-PCI...
HPC

第4世代 AMD EPYC プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2022年11月10日、第4世代 AMD EPYC™ プロセッサー(開発コード名:Genoa)がリリースされました。新マイクロアーキテクチャ「Zen 4」を採用し、5nm製造プロセスにより微細化されて、1ソケットで最大96コア、2ソケットで最大192コアという多コア構成が可能になったことに加え、DDR5-4800メモリに対応してメモリチャンネルが12本に増えたことでメモリ帯域も太く構成されている点が特長です。また、AVX-512命令に対応してAI・HPCワークロード向けに機能強化された他、キャッシュ階層と分岐予測の改善に...
HPC

Core i9-12900KでのGaussianベンチマーク

第12世代インテル® Core™ i9プロセッサーの12900Kは、Performance-core(P-core)を8個・Efficient-core(E-core)を8個搭載したデスクトップPC向けハイエンドプロセッサーです。実計算における性能を明らかにするため、量子化学計算のデファクトスタンダードであるGaussian16にてベンチマークを行いました。 ベンチマーク環境 サーバー: HPC2000-CAL104TA CPU: Intel® Core™ i9-12900K メモリ: 32GB DDR5-4800 ECC UDIMM x2 ソフトウェア: Windows 11 ...
DL

Geforce RTX4090 ベンチマーク

Ada Lovelace アーキテクチャ  Geforce RTX 4090は、新型GPUアーキテクチャ「Ada Lovelace」を採用する初めてのGPUです。製造プロセスが4nmになり微細化が進み、GPUコア数、周波数が劇的に伸びました。また、Tensorコアは第4世代となり、FP8演算エンジンも搭載されました。 RTX4090スペック 今回、比較したGeforce RTX3090と、Geforce RTX4090のスペックを下表にまとめました。   Geforce RTX 4090 Geforce RTX 3090 アーキテクチャ Ada Lovela...
HPC

LAMMPS 23Jun2022 update1に関して

LAMMPS 概説 LAMMPSは、Large-scale Atomic/Molecular Massively Parallel Simulatorの略で、材料モデリングに重点を置いた古典的な分子動力学シミュレーションです。 元々はF77で書かれていました。LAMMPS 99がF77で、LAMMPS 2001がF90で書かれていたバージョンです。とあるMPIの実装実験の時、手頃な負荷のアプリが欲しいという事で、C++に書き換えられました。現在のLAMMPSは、2005年に公開されたC++版を祖とするものです。 オープンソースでフリーである事から、特にスパコンで様々な実装実験などに使われ...
HPC

インテル12900Kの理論性能について

図1 第12世代インテル® Core™ i9 プロセッサー12900K 現在、第12世代インテル® Core™ i9 プロセッサー12900Kを搭載した当社ワークステーション の評価を行っています。 このCPUは、最大 8 個の高性能コア (P コア) と最大 8 個の高効率コア (E コア) からなるハイブリッド・アーキテクチャーを採用しています。インテル® スレッド・ディレクターが、Pコア/Eコアをワークロードへ適切に割り当てるということですが、そもそもの理論性能は?と思って調べました。が、どこにも見当たりません。 そこで自分で計算してみました。 表 周波数は、P...
HPC

RoCE対応スイッチベンチマークテスト

今回、RoCE対応スイッチと、実用アプリケーションであるVASPとAmberでベンチマークを取得しました。RoCE環境でInfiniBand-EDR環境に匹敵する性能が得られています。 RoCE環境では、InfiniBand-EDR環境と異なり、ドライバーソフトやMPIのバージョン変更が必要になりますが、リードタイムなどのメリットを勘案すると、注目に値する選択肢と考えられます。   VASPベンチマーク結果 VASPはプロセス間通信が頻発するアプリケーションです。今回は、VASP 5.4.4p1 1,000 atoms (PAW GGA)を使用し、RoCE環境の計算時間比を取得し、In...
HPC

GRRMチュートリアル2022の参加者を募集しています

弊社でもバージョン20を販売しておりますGRRMについて、基本的な理論や使い方を修得することができるGRRMチュートリアルが今年も量子化学探索研究所主催で開催されます。Zoomを用いたオンライン開催ですので、遠方のお客様も参加しやすい形態となっています。GRRMを使ってみたいけど、使いこなせるか心配、といった方は、とても適したチャンスです! 開催概要やお申込みにつきましては以下をご参照ください。 GRRMチュートリアル2022 (オンライン方式) 2022年度のGRRMチュートリアルが下記の要領で開催されます。  日時: 10月19(水)10:00-16:30  (受付開始: 9:30...
CAE

[ANSYS導入事例]Linuxにログイン不要なクラスタ環境

ANSYS Mechanical での構造解析や ANSYS Icepak での流体解析、ANSYS Discovery での設計と解析などを行っている製造業のお客様に、弊社の計算機クラスタシステムをご導入いただいた事例を紹介します。 こちらのお客様は、弊社製Windowsワークステーション4台をご使用いただいておりましたが、ユーザー様が多くワークステーションの使用率が高く、運用管理が難しいという課題がございました。 CAE用システムのリプレースにあたり、ジョブスケジューラ設定をされたLinuxクラスタを導入することで運用の改善をご検討されていました。しかしながら、多くのユーザー様はL...
CAE

[ANSYS導入事例]FSI解析のバッチ実行

ANSYS Mechanical での構造解析や ANSYS Fluent での流体解析を行っている製造業のお客様に、弊社の計算機クラスタシステムをご導入いただいた事例を紹介します。 こちらのお客様は、他社が導入したクラスタシステムをご使用なさっていましたが、流体構造連成解析(FSI解析:流体の流動と構造物の変形の相互作用を考慮した解析)をバッチ実行できない課題を抱えていらっしゃいました。 既存システムおいては、FSI解析をバッチ実行するために必要な ANSYS Remote Solve Manager との連携に問題があったため、まずは問題の原因を特定して動作検証を行い、課題解決の目途を...
CAE

[ANSYS導入事例]WindowsワークステーションからLinuxクラスタへの移行

ANSYS HFSSで電磁界解析を行っている製造業のお客様に、弊社の計算機クラスタ環境をご導入いただいた事例を紹介します。 こちらのお客様は30台ほどのWindows計算機を所有されていて、それぞれのユーザー様が直接Windows計算機にリモートデスクトップ接続でログインをしてHFSSの電磁界解析を行われておりました。 従来の環境では、お客様が操作になれたWindows環境でHFSSを使用することができましたが、どのユーザー様がどのマシンを使っているかなどがわかりにくいという問題がございました。 そこで弊社より、CentOSおよびIBMのジョブ管理システム『LSF Community E...