HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

2022-10

DL

Geforce RTX4090 ベンチマーク

Ada Lovelace アーキテクチャ  Geforce RTX 4090は、新型GPUアーキテクチャ「Ada Lovelace」を採用する初めてのGPUです。製造プロセスが4nmになり微細化が進み、GPUコア数、周波数が劇的に伸びました。また、Tensorコアは第4世代となり、FP8演算エンジンも搭載されました。 RTX4090スペック 今回、比較したGeforce RTX3090と、Geforce RTX4090のスペックを下表にまとめました。   Geforce RTX 4090 Geforce RTX 3090 アーキテクチャ Ada Lovela...
計算化学

LAMMPS 23Jun2022 update1に関して

LAMMPS 概説 LAMMPSは、Large-scale Atomic/Molecular Massively Parallel Simulatorの略で、材料モデリングに重点を置いた古典的な分子動力学シミュレーションです。 元々はF77で書かれていました。LAMMPS 99がF77で、LAMMPS 2001がF90で書かれていたバージョンです。とあるMPIの実装実験の時、手頃な負荷のアプリが欲しいという事で、C++に書き換えられました。現在のLAMMPSは、2005年に公開されたC++版を祖とするものです。 オープンソースでフリーである事から、特にスパコンで様々な実装実験などに使われ...
HPC

インテル12900Kの理論性能について

図1 第12世代インテル® Core™ i9 プロセッサー12900K 現在、第12世代インテル® Core™ i9 プロセッサー12900Kを搭載した当社ワークステーション の評価を行っています。 このCPUは、最大 8 個の高性能コア (P コア) と最大 8 個の高効率コア (E コア) からなるハイブリッド・アーキテクチャーを採用しています。インテル® スレッド・ディレクターが、Pコア/Eコアをワークロードへ適切に割り当てるということですが、そもそもの理論性能は?と思って調べました。が、どこにも見当たりません。 そこで自分で計算してみました。 表 周波数は、P...
HPC

RoCE対応スイッチベンチマークテスト

今回、RoCE対応スイッチと、実用アプリケーションであるVASPとAmberでベンチマークを取得しました。RoCE環境でInfiniBand-EDR環境に匹敵する性能が得られています。 RoCE環境では、InfiniBand-EDR環境と異なり、ドライバーソフトやMPIのバージョン変更が必要になりますが、リードタイムなどのメリットを勘案すると、注目に値する選択肢と考えられます。   VASPベンチマーク結果 VASPはプロセス間通信が頻発するアプリケーションです。今回は、VASP 5.4.4p1 1,000 atoms (PAW GGA)を使用し、RoCE環境の計算時間比を取得し、In...