HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

HPC

numpyにおけるCPU最適化

IcelakeはRHEL、CentOS や AlmaLinuxなど、RHEL8系からの対応という事で、RHEL8系へのOSの変更といった事例が増えています。RHEL8系ならではの様々な違いなどもありますが、困ってしまうのがpythonの扱いです。RHEL8系はOSの管理用のpythonとユーザー環境用のpythonが分れているなどの違いもありますが、python2のサポート終了に関係して、site-packageを入れたrpmパッケージが少ないなどもあり、OS付属のpython2.7を使用するのは如何なものか、というのが実際のところです。 いやいや、python3を使えばいいじゃないというの...
CTO

LAN通信速度の計測方法

背景: 大容量データサービスの拡大に伴い、これまで基幹網で使用されてきた10GbEがアクセス網でも構築されるようになっています。 また、FTTHにおいても、10GE-PONの研究・開発が進められているなど、加入者へ高速大容量通信網を提供するための取り組みが加速しているので、現行の検証手段(Ping Loopテスト)は評価条件に満たないと認識しており、スピード実際値も測るべきと考えております。 使用ツール:Iperf3 検証条件: TCPウィンドウサイズ:921600KB 通信時間      :120秒 ジャンボ パケット  :9014Bytes 検証ステッ...
DL

RTX A5000、NVIDIA A10 ベンチマーク公開

先日のNVIDIA RTX A6000のベンチマークに続いて、NVIDIA RTX A5000、NVIDIA A10のベンチマーク情報を公開しました。 NVIDIA RTX A5000、NVIDIA A10のDeep Learning学習性能を、NVIDIA RTX A6000、Geforce RTX3090と比較し、検証しています。 スペック情報 NVIDIA RTX A6000、NVIDIA RTX A5000、Geforce RTX3090、NVIDIA A10のスペック比較です。 (※公開情報などからの推測値です) GPU型番 RTX A60...
HPC

ウェビナーへどうぞご参加ください!計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~のご案内

このウェビナーにはFX700や「富岳」などのA64FX環境での技術的な話題もありますので、Tech Blogでも紹介をさせてください。 無料ウェビナー 計算化学の最前線 ~富岳テクノロジーが加速するHPC・AI~ 弊社の講演者からは、FX700や「富岳」にて計算化学アプリケーションを安定動作させるため&高速化させるために行った試行錯誤をいくつか報告いたします。 「富岳」をクラウド計算資源として実務に活用していく際にFX700がどのように役に立つかを、わかりやすさを大切にしながら説明いたします。 「富岳」やHPCクラウドにご興味がございましたら、どうぞご参加ください!
HPC

Intel HPC Forum 2021のご案内

Intel HPC Forum 2021が6月23日(水)にオンラインにて開催されます。 弊社はパートナーとして後援しています。ぜひご参加ください。   < 概要 > < アジェンダ > ▶13:00-13:05 「開会の挨拶」 インテル株式会社 技術本部 執行役員常務 技術本部長 土岐英秋 ▶13:05-13:15 「インテル HPC/AI 戦略の革新」 インテル株式会社 ビジネス・デベロップメント・グループ  HPC事業開発マネージャー 矢澤 克巳 ▶13:15-13:35 「最新のインテル® Xeon® スケーラブル・...
HPC

「富岳」でのアプリビルド検証状況

理化学研究所と進めさせていただいている「富岳」のクラウド的利用共同研究プロジェクトの中で、弊社でセットアップ実績のあるアプリケーションの「富岳」でのビルドに取り組んできました。 性能も電力対性能も世界一の「富岳」を使ってみたい、でもA64FX(aarch64)でいつも使っているアプリケーションが問題無く動くのかわからない、という不安もおありなのではと思いますので、生の事実を共有いたします。 量子化学 - Gaussian16 弊社では2020年7月からGaussian社と一緒に報告・検証を進めてきました。紆余曲折ありましたが、今年2月中旬に入手したGaussian社公式バイナリを用い...
量子コンピュータ

世界最速の量子コンピュータ用汎用コンパイラ「tket」を使ってみた

はじめに  量子コンピュータを活用するには、もちろんそのためのプログラムが必要です。古典コンピュータの黎明期では、ユーザがハードウェアの特性をよく理解した上で、やりたい計算を実現する回路を物理的に組んでいく必要がありました。やがて、コンパイラが発明され、ユーザはハードウェアの特性をさほど意識することなく、人間が理解しやすい言葉でプログラムを書き、コンパイラを通じてやりたい計算を実現できるようになりました。量子コンピュータも当初はユーザが物理的な量子回路を構築する必要がありましたが、量子コンピュータ用のコンパイラの開発が進み、現在では人間が理解しやすい言葉で量子コンピュータを運用することが可能...
HPC

第3世代Xeonスケーラブル・プロセッサーベンチマーク

日本時間2021年4月7日、第3世代 Xeon スケーラブル・プロセッサーがリリースされました。 弊社で行ったベンチマーク報告書をこちらからダウンロードいただけます。 実用アプリケーションでのベンチマークで、前世代に比べて実効性能向上が得られていることを定量的に報告しています。 どうぞご覧ください!
量子コンピュータ

量子コンピュータ勉強会レポート(その4) ~量子コンピュータの量子化学研究最前線~

はじめに  QPARC基礎コース最終回となる第6回勉強会では、量子コンピュータ分野に関連した最先端の量子化学研究について学び、また産業界からアカデミアへの提言について議論しました。これまで、主に量子化学への応用という観点から、量子コンピュータのソフト・ハードの基礎を学んできましたが、今回は最先端の研究内容が多分に含まれており、個人的にはかなり難しい内容でした。このレポートも誤解や誤り等あるかもしれませんので、お気づきの方がいらっしゃれば、ご指摘いただけると幸いです。  また今回のQPARCでは、スポンサーセッションにて主に弊社の計算化学サービスについてご紹介させていただきました。このような...
計算化学

MPI or openMP

DFTB+という電子特性を研究する為の量子シミュレーションプログラムがあります。 ごく偶にお問い合わせがある古くからあるアプリです。 色々な事が出来るのですが、研究分野を離れたところで興味深い点がありまして、それは、元々、並列をOpenMPで実装していたという点です。 ver17.1までは、OpenMPだけで実装されていました。 ところが、ver19.1でなんとMPIも実装されたという事で、比較試験を行なってみました。 手頃な計算時間のかかるインプットはないかいなという事で、レシピというサンプルの中の2D carbon armchairのv1 densityを求めるインプット...
DL

NVIDIA RTX A6000 ベンチマーク公開

先日の、NVIDIA A100のベンチマークに続いて、NVIDIA RTX A6000 のベンチマーク情報を公開しました。 NVIDIA RTX A6000の Deep Learning 学習性能を、NVIDIA A100、Tesla V100Sと比較し、検証しています。 スペック情報 NVIDIA A100-PCIE、NVIDIA RTX A6000、NVIDIA V100S-PCIEのスペック比較です。 NVIDIA RTX A6000は、一部公開されていません。 GPU型番 NVIDIA A100-PCIE NVIDIA RTX A6000 ...
DL

NVIDIA A100 ベンチマーク公開

Nvidia A100 のベンチマーク情報を公開しました。 今回は、CNNだけでなくBERTでもベンチマークしました。下からダウンロードページに飛びます。 今回、アーキテクチャがAmpereへと更新され、性能向上だけでなく、様々な機能が搭載されました。 スペック情報 NVIDIA A100-PCIEと、NVIDIA V100S-PCIEのスペック比較です。 TensorCore、FP16の性能が大きく伸びました。 GPU型番 NVIDIA A100-PCIE NVIDIA Tesla V100S-PCIE アーキテクチャ ...
量子コンピュータ

量子コンピュータ勉強会レポート(その3) ~量子コンピュータ上での量子化学計算~

はじめに  先月の中頃、2020年のQPARCの活動が無事幕を下ろしました。2021年も活発な活動を行っていくものと期待されますが、ここではこれまでのQPARC活動内容を何回かに分けてご報告したいと思います。今回はQPARC第3回~第5回基礎コース勉強会および第3回勉強会補習講座のご報告です。  第2回勉強会レポートでも述べましたが、ひとまず現在~近い将来では、量子ビット情報のエラー訂正を行わないNISQ(Noisy Intermediate-Scale Quantum device:ニスク)と呼ばれる量子コンピュータが主流となります。ただしNISQでは量子ゲート数(演算回数)が多くなると...
HPC

EBOF検証はじめました2

図は、EBOFとその上位サーバから構成されるEBOFシステムのアーキテクチャ概要です。本システムは、NVMeOF,RDMA,RoCEv2を組み合わせて実現しています。 ・NVMeOF(NVMe over Fabric)が、Fabric経由で接続されるNVMeデバイスにブロックデバイスインタフェースを提供します。 ・RDMAが、PCIe経由のIOをCPUからオフロードする処理を担当します。 ・RoCEv2(RDMA over Converged Ethernet v2)が、PCIeデータをUDPで梱包し、イーサネット経由でEBOF側SSDに転送する処理を担当します。 これにより、本シ...
HPC

EBOF検証はじめました

最近、ストレージに関して、お悩みありませんか? このままハードディスクを使い続けようか?それとも、価格と性能が遜色なくなりつつあるSSDをもっと活用してみようか?と、思っていらっしゃいませんか?そんなあなたに、弊社で最近、検証を始めたストレージ装置を紹介させてください。 近年、Deep Learningなどの領域では、処理対象データが指数的に増加する一方、SSD技術の進展により、HPC/AI市場におけるストレージ装置の位置づけが変化しています。 お客様は、処理対象データのプレ・ポスト処理の生産性向上やスケーラビリティなどを確保するため、広帯域、大容量、低遅延なIOパフォーマンスを実現す...
DL

NVIDIA® V100S vs A100™ Deep Learning Benchmarks

NVIDIA V100S PCIe 32GB とA100™ PCIe 40GB の Deep Learning 学習での性能評価のため、HPC5000-XCLGPU4TS (PCIe Gen3)とHPC5000-ERMGPU8R4S (PCIe Gen4)にGPUを1枚、2枚、3枚、4枚を実装して、nvidia/tensorflow:20.11-tf1-py3を実行してみました。 製品名:HPC5000-XCLGPU4TS CPU Intel(R) Xeon(R) Gold 6242, CPUクロック 2.8 GHz, CPUコア 32, メモリ容量 192GB, 2933 MT/s   ...
計算化学

VASP:事前/事後処理に使うソフトウェアの紹介

はじめに この記事では、GUI上で操作できる無償のものを中心に、VASPの事前・事後処理を行うソフトウェアを紹介します。 入力ファイルを入手する VASPで計算を行うためには以下4つの入力ファイルを用意する必要があります。 POSCAR 対象となる物質の結晶構造データ POTCAR 物質中の各原子の擬ポテンシャルデータ INCAR 計算方法などの設定 KPOINTS 計算するk点の設定 初めて利用される方がこれらのファイルをいきなり自作するのは大変です。そこでまずは, 以下のデータベースから目的の物質を探し、入力ファイルを入手する...
HPC

VASP:結果の可視化について

はじめに VASPは密度汎関数理論(Density Functional Theory: DFT)に基づいて電子状態を計算するソフトウェアです。擬ポテンシャル法を採用しており、全電子計算を行うWIEN2kなどのソフトウェアに比べて高速に計算できます。また、精度に関しても良い成績を残しており、様々な分野で広く使われています。 しかし一方で、VASPの出力形式は状態密度(Density of state: DOS)・バンド分散・フェルミ面などの基本的な解析結果を可視化しづらく、計算実行後に出力ファイルを編集する手間が必要です。この点はQuantum ESPRESSOの方がユーザーフレンドリーな...
計算化学

DALTONを高速化

DALTONという名前の量子化学プログラムスイートがあります。 この名称は、ホームページで人物の姿があるように、John Dalton博士をリスペクトしたものだろうという事は分るのですが、イギリス系の地名や姓など、かなり一般的な単語の為、Web用の検索エンジンを単純に使用すると、関連の無いものばかりが並ぶ事になるという困ったアプリでもあったりします。 このDALTON、かなり古くから存在するもので、最初のリリースは1983年、version 1.0が1997年 というものなので、スパコン世代の癖がかなり濃厚に残っているアプリです。 2011年以降、DALTONはバージョンナンバーがv...
計算化学

AMD Ryzen Threadripper で Gaussian

AMD Ryzen Threadripper はデスクトップPC用途ですが、コアをEPYCと共通化させているため、コア自体の底力は、なかなか期待できるものです。 Gaussian16 Rev. C.01 でいつものtest0397を動かしてみました。使ったCPUは Threadripper 3970X (32core, 3.7GHz) です。 けっこうIntel Xeonと善戦していることがわかります。手ごろな価格でGaussian計算機を探している方には朗報ですね。