HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

nabeo

DL

RTX A5500、RTX 5000 Ada MLベンチマーク公開

NVIDIA RTX A5500 と RTX 5000 Ada の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、これらのGPUに NVIDIA A6000 と RTX 4090 を加えた計4種のGPUで、機械学習の学習性能を比較評価しています。 スペック情報 NVIDIA RTX A5500、RTX 5000 Ada、RTX A6000、GeForce RTX 4090 のスペック比較表は次のとおりです。青文字は資料などからの推測値です。 GPU型番 NVIDIA RTX A5500 NVIDIA RTX 5000 Ada ...
DL

NVIDIA L40S MLベンチマーク公開

NVIDIA L40S の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、NVIDIA A100 を加えた計2種のGPUで、機械学習の学習性能を比較評価しています。 ベンチマーク報告書のダウンロードはこちら >> スペック情報 NVIDIA L40S、NVIDIA A100 のスペック比較表は次のとおりです。青文字は資料などからの推測値です。 GPU型番 NVIDIA L40S NVIDIA A100 アーキテクチャ Ada Lovelace Ampere ...
HPC

第4世代 AMD EPYC 97X4 プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年6月13日、新コアを採用した第4世代 AMD EPYC™ 97X4 プロセッサー(開発コード名:Bergamo)がリリースされました。開発コード名Genoaの第4世代 AMD EPYC™ プロセッサーと比べると、論理的には「Zen 4」と同じながら物理設計を変更してCPUコアのエリアサイズが縮小されている、従来の4MB/コアから2MB/コアに3次キャッシュが縮小されている、1つのダイに2つのCCXが搭載されそれらがIoD経由で通信される、といった差異があります。この新プロセッサーは元々クラウドのワークロード向け...
計算化学

GRRMチュートリアル2023の参加者を募集しています

最新バージョン23をご好評いただいておりますGRRMについて、基本的な理論や使い方を修得することができるGRRMチュートリアルが今年も量子化学探索研究所主催で開催されます。久しぶりの現地開催となります。GRRMを使ってみたいので、基本的な使い方を学び、アドバンスドな内容にも触れてみたい、といった方に強くお勧めいたします! 開催概要やお申込みにつきましては以下をご参照ください。 GRRMチュートリアル2023 2023年度のGRRMチュートリアルが下記の要領で開催されます。  日時:11月24日(金)10:00-16:30  (受付開始: 9:30)  主催:NPO法人量子化学探索研究...
HPC

[要点を掴む] CUDAアプリの動かし方

CUDAってどんなもの? 『CUDA』は、NVIDIA社のGPUをグラフィック処理以外の汎用の計算用途に使えるようにするための、統合開発環境(コンパイラ等)とランタイムライブラリの集合です。 GPUの内部アーキテクチャは、CPUよりもコア数・スレッド数が大変多い構造になっています(数千スレッド~)。また、GPU上の処理を記述するには、CUDAが登場するより前には、 シェーディング言語といったグラフィック処理専用のプログラミング言語を使いこなす必要がありました。 こうした状況に対し、NVIDIA社はGPUのポテンシャルを簡単に引き出せるようにするべく、CUDAを提供してきました。CUDA環...
HPC

NVLink BridgeでGPUを繋いでも1GPUにはなりません

『NVLink Bridgeで複数GPUを繋いだら、それらが1GPUとして扱えるようになるんでしょ?』という誤解をされているお客様をしばしばお見受けいたします。こちらの記事では、それが誤解であること、また、SLIやUnified Memoryといった関連する情報についても整理して解説いたします。間違った期待を抱いて失敗しないように、正しい理解を深めていきましょう。 GPUのメモリ空間は他デバイスから隔絶されています GPU上には演算するためのプロセッサと、データを一時的に置いておくためのメモリ(VRAM)が搭載されています。GPUのメモリを、CUDAで書かれたプログラムから利用するには、c...
HPC

マシンに最適な Gaussian16 をインストールする手順

はじめに 以下では、Gaussian16 の Unix 向けバイナリ版のインストール手順を解説しています。 単に標準的な手順を知りたいだけであればGaussian社公式のインストール手順を読めば事足りるのですが、大学様の計算機センターなどで複数のバイナリをお持ちの場合に、お使いの計算機に適したバイナリを特定する方法や、そこで間違った際のエラーなど、補足情報も以下に記載しています。 計算機の性能を最大限に引き出すロジックを身に着けていただいて、ご業務の時短に活かしていただければ幸いです。 全体的に Gaussianのインストールにあたっては、Gaussian社の公式サイトにある Ins...
HPC

第4世代 インテル Xeon スケーラブル・プロセッサー ベンチマーク

※2023年5月17日に改めて公開いたしました。 ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年1月10日(日本時間11日)、第4世代 インテル🄬 Xeon🄬 スケーラブル・プロセッサー(開発コード名:Sapphire Rapids)がリリースされました。「Intel 7」製造プロセスにより微細化され、1ソケットに最大56コアを搭載可能になったことに加え、CPU間のUPI接続がCPUあたり最大4本に増加し、その速度が16 GT/sに向上しました。また、新たにDDR5-4800のメモリに対応して、より太いメモリ帯域に進化しました。さらに、データ移動のための...
DL

NVIDIA H100, GeForce RTX 4090 MLベンチマーク公開

NVIDIA H100 と GeForce RTX 4090 の機械学習ベンチマーク報告書をこちらで公開しました。報告書の中では、これらのGPUに NVIDIA A100 と RTX 3090 を加えた計4種のGPUで、機械学習の学習性能を比較評価しています。 スペック情報 NVIDIA H100 PCIe、NVIDIA A100 PCIe、GeForce RTX 4090、GeForce RTX 3090 のスペック比較表は次のとおりです。CUDAコア数とGPU Boost時クロックが向上していることがわかります。 GPU型番 NVIDIA H100-PCI...
HPC

第4世代 AMD EPYC プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2022年11月10日、第4世代 AMD EPYC™ プロセッサー(開発コード名:Genoa)がリリースされました。新マイクロアーキテクチャ「Zen 4」を採用し、5nm製造プロセスにより微細化されて、1ソケットで最大96コア、2ソケットで最大192コアという多コア構成が可能になったことに加え、DDR5-4800メモリに対応してメモリチャンネルが12本に増えたことでメモリ帯域も太く構成されている点が特長です。また、AVX-512命令に対応してAI・HPCワークロード向けに機能強化された他、キャッシュ階層と分岐予測の改善に...
HPC

Core i9-12900KでのGaussianベンチマーク

第12世代インテル® Core™ i9プロセッサーの12900Kは、Performance-core(P-core)を8個・Efficient-core(E-core)を8個搭載したデスクトップPC向けハイエンドプロセッサーです。実計算における性能を明らかにするため、量子化学計算のデファクトスタンダードであるGaussian16にてベンチマークを行いました。 ベンチマーク環境 サーバー: HPC2000-CAL104TA CPU: Intel® Core™ i9-12900K メモリ: 32GB DDR5-4800 ECC UDIMM x2 ソフトウェア: Windows 11 ...
HPC

GRRMチュートリアル2022の参加者を募集しています

弊社でもバージョン20を販売しておりますGRRMについて、基本的な理論や使い方を修得することができるGRRMチュートリアルが今年も量子化学探索研究所主催で開催されます。Zoomを用いたオンライン開催ですので、遠方のお客様も参加しやすい形態となっています。GRRMを使ってみたいけど、使いこなせるか心配、といった方は、とても適したチャンスです! 開催概要やお申込みにつきましては以下をご参照ください。 GRRMチュートリアル2022 (オンライン方式) 2022年度のGRRMチュートリアルが下記の要領で開催されます。  日時: 10月19(水)10:00-16:30  (受付開始: 9:30...
情シス

これはおすすめ! Windowsのパッケージ管理システム

はじめに 皆さま、はじめまして。tnabuと申します。 HPC事業部・CTO事業部ではなく、社内の情報システムを管理するところに所属しております。従業員が日頃使用するPCをセットアップするという業務もあります。 その中で、誰もが使用する基本的なアプリケーションをインストールする作業もあり、抜けもれなく、かつ、手短に作業を進められる方法を調べてみましたので報告します。 パッケージ管理システムとは Wikipediaによると「各種のソフトウェアの導入と削除、そしてソフトウェア同士やライブラリとの依存関係を管理するシステム」となっています。様々なアプリケーションを使用するときに、関連す...
HPC

ウェビナーへどうぞご参加ください!計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~のご案内

このウェビナーにはFX700や「富岳」などのA64FX環境での技術的な話題もありますので、Tech Blogでも紹介をさせてください。 無料ウェビナー 計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~ 弊社の講演者からは、FX700や「富岳」にて計算化学アプリケーションを安定動作させるため&高速化させるために行った試行錯誤をいくつか報告いたします。 「富岳」をクラウド計算資源として実務に活用していく際にFX700がどのように役に立つかを、わかりやすさを大切にしながら説明いたします。 「富岳」やHPCクラウドにご興味がございましたら、どうぞご参加ください!
HPC

「富岳」でのアプリビルド検証状況

理化学研究所と進めさせていただいている「富岳」のクラウド的利用共同研究プロジェクトの中で、弊社でセットアップ実績のあるアプリケーションの「富岳」でのビルドに取り組んできました。 性能も電力対性能も世界一の「富岳」を使ってみたい、でもA64FX(aarch64)でいつも使っているアプリケーションが問題無く動くのかわからない、という不安もおありなのではと思いますので、生の事実を共有いたします。 量子化学 - Gaussian16 弊社では2020年7月からGaussian社と一緒に報告・検証を進めてきました。紆余曲折ありましたが、今年2月中旬に入手したGaussian社公式バイナリを用い...
HPC

第3世代Xeonスケーラブル・プロセッサーベンチマーク

日本時間2021年4月7日、第3世代 Xeon スケーラブル・プロセッサーがリリースされました。 弊社で行ったベンチマーク報告書をこちらからダウンロードいただけます。 実用アプリケーションでのベンチマークで、前世代に比べて実効性能向上が得られていることを定量的に報告しています。 どうぞご覧ください!
HPC

DALTONを高速化

DALTONという名前の量子化学プログラムスイートがあります。 この名称は、ホームページで人物の姿があるように、John Dalton博士をリスペクトしたものだろうという事は分るのですが、イギリス系の地名や姓など、かなり一般的な単語の為、Web用の検索エンジンを単純に使用すると、関連の無いものばかりが並ぶ事になるという困ったアプリでもあったりします。 このDALTON、かなり古くから存在するもので、最初のリリースは1983年、version 1.0が1997年 というものなので、スパコン世代の癖がかなり濃厚に残っているアプリです。 2011年以降、DALTONはバージョンナンバーがv...
HPC

AMD Ryzen Threadripper で Gaussian

AMD Ryzen Threadripper はデスクトップPC用途ですが、コアをEPYCと共通化させているため、コア自体の底力は、なかなか期待できるものです。 Gaussian16 Rev. C.01 でいつものtest0397を動かしてみました。使ったCPUは Threadripper 3970X (32core, 3.7GHz) です。 けっこうIntel Xeonと善戦していることがわかります。手ごろな価格でGaussian計算機を探している方には朗報ですね。
HPC

NVIDIA A100 GPU製品が発表されました!

オンライン開催の GTC 2020( )にて NVIDIA CEO Jensen Huang氏 の Keynote がアナウンスされました。発表は NVIDIA YouTube Channel ( ) で 公開されています。プレイリストはこちらです。 AIやデータサイエンス、HPC、自動運転やグラフィックなどに関する新情報が次々と出てきています。 NVIDIA A100 GPU。最新Ampere世代、TensorFloat32に対応し、Sparse Matrixに最適化された新たなTensorCore と 1.5TB/sの高帯域なHBM2を備え、PetaOPS級の性能。ますますD...
HPC

arXiv新記事を自動で見張らせてみた

概要 IFTTTの面白さを再発見し、作ってみました。arXiv(RSS feed) ⇒ IFTTT ⇒ Slack 、これでイメージできる方は、はい、それです。 背景 新しい学術情報の収集にarXivのプレプリントを見ている方は少なからずいらっしゃるでしょう。もちろん、それ以外の論文掲載サイトもたくさんありますが、大抵、更新があるかどうかは見に行かないとわからないし、それに、見に行ったけど更新がなくて残念ということもあるでしょう。更新があったときだけ高頻度に読むメディアに通知してくれたら便利ですよね。それも、自分の興味のあるキーワードに引っかかる更新だけについて通知してくれたら・・・。私...