HPCシステムズではエンジニアを募集しています。詳しくはこちらをご覧ください。
HPCシステムズのエンジニア達による技術ブログ

Tech Blog

HPC

HPC

PLiOPS Extreme データプロセッサ (XDP)レビュー

●はじめに サーヴァンツインターナショナル社が取り扱う,PLiOPS Extremデータプロセッサ(XDP)を検証する機会をいただきましたので、ご報告いたします。 ●PLiOPS Extreme データプロセッサ(XDP)とは PLiOPS Extreamデータプロセッサ(XDP)は、PCI-Expressカード型のアクセラレートカードです。SSD 向けデータ保護機能を提供するとともに、RAIDリビルド時間の短縮など、従来の RAID コントローラーの制限を克服し、SSD の耐久性と使用寿命を延ばし、容量を解放します。 ●PLiOPS社とは PLiOPSは 2017 年に設立...
HPC

当社がビルドしたGAMESSの特徴

概要 ソースコードで配布されているソフトウェアをコンパイル・リンクして計算機上で問題なく動作可能とする行為を「ビルド」と呼んでいます。 今回、当社がビルドした GAMESS September 30, 2023 R2 について、 どのようなソフトウェア/機能を組み込んだのか どんなテストを行い、その結果はどうだったのか どんなトラブルがあったのか、どう解決したのか をまとめたページを作成しました。こちらです。 ビルドを通じてお客様の力になります C/C++ や Fortran のソースコードを自分でコンパイルしたことのある方にとっては、「わざわざビルドについて...
HPC

PuTTYに深刻な脆弱性

弊社のサーバーを使用する場合、直接、ターミナルで使用する場合もあるかとは思いますが、手元のWindowsパソコンやノートから、PuTTYを使用してsshでログインして使用することがあるかと思います。 2024年4月16日、このPuTTYに深刻な脆弱性があるとの報道が出ました。発端は、X(旧twitter)で、以下のようなPyttyに関する深刻な脆弱性に関する報告が出た事のようです。 一番、分り易い記事としては、窓の社さんから、「「PuTTY」に秘密鍵が復元できてしまう深刻な脆弱性 ~「WinSCP」など他ツールにも影響」という記事が出ています。 記事にもあるように、PuT...
HPC

当社がビルドしたAmberの特徴

概要 ソースコードで配布されているソフトウェアをコンパイル・リンクして計算機上で問題なく動作可能とする行為を「ビルド」と呼んでいます。 今回、当社がビルドした Amber22 について、 どのようなソフトウェア/機能を組み込んだのか どんなテストを行い、その結果はどうだったのか どんなトラブルがあったのか、どう解決したのか をまとめたページを作成しました。こちらです。 ビルドを通じてお客様の力になります C/C++ や Fortran のソースコードを自分でコンパイルしたことのある方にとっては、「わざわざビルドについて書くことなど何もないのでは?」と思われるか...
HPC

当社がビルドしたQuantum ESPRESSOの特徴

概要 ソースコードで配布されているソフトウェアをコンパイル・リンクして計算機上で問題なく動作可能とする行為を「ビルド」と呼んでいます。 今回、当社がビルドした Quantum ESPRESSO 7.2 について、 どのようなソフトウェア/機能を組み込んだのか どんなテストを行い、その結果はどうだったのか どんなトラブルがあったのか、どう解決したのか をまとめたページを作成しました。こちらです。 ビルドを通じてお客様の力になります C/C++ や Fortran のソースコードを自分でコンパイルしたことのある方にとっては、「わざわざビルドについて書くことなど何も...
HPC

当社がセットアップするRHELの特徴

概要 今回、当社がセットアップしている System Integration Pack(SIP)構成時の RHEL 8系 OSについて、 どのようなソフトウェアを組み込んだのか どのようなOS設定を施しているのか をまとめたページを作成しました。こちらです。 高性能で安定した使いやすいOSを目指して行っていることを記載しております。どうぞご覧ください。
HPC

当社がビルドしたLAMMPSの特徴

概要 ソースコードで配布されているソフトウェアをコンパイル・リンクして計算機上で問題なく動作可能とする行為を「ビルド」と呼んでいます。 今回、当社がビルドした LAMMPS 2 Aug 2023 update 1 GPU版 について、 どのようなソフトウェア/機能を組み込んだのか どんなテストを行い、その結果はどうだったのか どんなトラブルがあったのか、どう解決したのか をまとめたページを作成しました。こちらです。 ビルドを通じてお客様の力になります C/C++ や Fortran のソースコードを自分でコンパイルしたことのある方にとっては、「わざわざビルドに...
HPC

SLC採用、高速NVMe™ SSD KIOXIA FL6 レビュー

はじめに 今回、KIOXIA社が横浜に開設したKIOXIA Innovation Labを利用して、SLC(Single Level Cell)を採用した高速NVMe™ SSD、FL6をリモート評価させていただく機会をいただきました。 KIOXIA Innovation Labとは KIOXIA Innovation Labは、KIOXIA社が提供するクラウド型のKIOXIA製品PoC施設です。KIOXIA社の最新SSDや関連技術、ソフトウエアを評価できる環境を利用することが可能です。リモートからVPN接続しWebブラウザだけで利用可能でした。 K...
HPC

AMDの新GPU Instinct™ MI300シリーズについて

AMDのAI 向け新GPU製品 Instinct MI300X および Instinct MI300Aの詳細が発表されました。 ネットでは取り上げられなかった 情報も交えて紹介いたします。 ■Instinct MI300Xについて 図1 AMD Instinct MI300X 及び MI300A AMD InstinctMT MI300X は NVIDIA の H100 を凌駕するデータセンタ用の高性能 GPU です。すでに1月のCESの前日基調講演や6月の「Data Center and AI Technology Premiere」で発表されていましたが、今回サンノゼで開催さ...
HPC

Intel oneAPI 2024 がリリースされました

表題のとおり、intel社が開発・販売している開発用ソフトウェア、Intel oneAPIの新しいVersion、 Intel oneAPI 2024 がリリースされました。 Intel oneAPIは、基本となる Intel oneAPI Base Toolkit に、用途に応じた Toolkit を追加するという構成になっています。本文章では、科学技術計算用アプリケーションを使用されているユーザーに多い、Intel oneAPI Base Toolkitに oneAPI HPC toolkitを加えた環境について話をしていきます。 Intel oneAPI 2023から2024において...
HPC

NVDIA A100搭載水冷静音ワークステーションの検証を始めました。(1)

はじめに 昨今、HPCにおいてはCPU・GPUの演算性能が向上し、それに伴い必要な消費電力も増加しています。これにより、筐体内の熱を効果的に排熱する方法が課題となっています。この課題に対処する一つの方法として、水冷式が注目されており、当社でもデスクサイドに設置可能な水冷式ワークステーション『HPC5000-XSRGPU4TS-LC』の販売を開始しました。 今回は、この装置の外観・内観、およびGPU BurnにおけるGPUの検証結果をご紹介いたします。 スペック情報 プロセッサー 第4世代 インテル® Xeon® スケーラブル・プロセッサー (最大TDP 270W) ...
HPC

計算機もウソをつく ~丸め誤差について~

今回、倍精度浮動小数点演算時に発生する丸め誤差についてご報告します。みなさんには当たり前のこととおもいますが、HPC界は新参者の私には新たな発見の連続でした。 ある件で、線形代数演算ライブラリBLAS,LAPACKのことを調べているときに、理化学研究所計算科学研究センタ中田さんが公開されている資料「線形代数演算ライブラリBLAS とLAPACKの基礎と実践 (I) BLAS, LAPACK入門編 」を拝見していました。 この資料の中で、計算機の計算結果が、数学上の計算式と違うことがあるよ、こんなソースだよ、と教えてもらいました。 ある数aにある数bを足して、あ...
HPC

Schrӧdinger 向けGPUクラスタシステム導入事例

Schrӧdingerでシミュレーションを行っている製薬企業のお客様に、当社の計算機クラスタシステムをご導入いただいた事例を紹介します。 Schrӧdingerは、最近ライセンス契約形態が変わり、GPU単位での課金からCUDAコア単位の課金になりました。そのため、計算手法とライセンスによっては、GPUを1枚そのままで使うよりも、MIGで分割して使ったほうがハードウェアリソース的にも経済的にも効率が良くなります。今回の場合では、   Desmond         → GPUを1枚そのまま   FEP+               → MIGで分割したGPU という運用が最適でした。...
HPC

第4世代 AMD EPYC 97X4 プロセッサー ベンチマーク

ベンチマーク報告書(PDF)のダウンロードはこちらからどうぞ! 概要 2023年6月13日、新コアを採用した第4世代 AMD EPYC™ 97X4 プロセッサー(開発コード名:Bergamo)がリリースされました。開発コード名Genoaの第4世代 AMD EPYC™ プロセッサーと比べると、論理的には「Zen 4」と同じながら物理設計を変更してCPUコアのエリアサイズが縮小されている、従来の4MB/コアから2MB/コアに3次キャッシュが縮小されている、1つのダイに2つのCCXが搭載されそれらがIoD経由で通信される、といった差異があります。この新プロセッサーは元々クラウドのワークロード向け...
HPC

新しい Intel Compiler 、icx の clang version 調査方法とCUDAとの連携について

以前の記事で、C/C++言語の Intel Compiler について解説しました。 新しいコンパイラ、icx は LLVMというコンパイラ基盤を元に開発されています。 LLVMとは何か、という解説は、簡単に説明することはなかなか難しいのですが、 コンパイラを作成する際に、いわば土台となるようなものであり (このため、コンパイラ基盤という表現をされます)、 この土台を利用することで、コンパイラの開発・最適化が効率よく行えます。 近年、この有用性が評価されたためか、LLVMを利用したコンパイラは増加傾向にあります。 LLVMはあくまでコンパイラの土台にあたるものですが、LLVMと同...
HPC

そのデータにストーリーはあるか?ーデータに踊らされないためにー

背景 昨今さまざまな数字、データ、グラフを目にする機会が増えています。その一方でそれらをどう解釈して読み解くのか、というリテラシーの問題が取り沙汰されるようになっています。テレビ等で誤解を生みかねないグラフ形式を選択していることなどに指摘がある一方で、意図的にそうした手法を用いているものから間違った判断に誘導される危険性もあります。統計データが直感に反する結論を導くことも珍しくありません。 どの様にデータを使い、見せ、意図を伝え、解釈されるのか?というのは受け側、出す側の両方に求められるリテラシーですが、一方で普段どおりの見せ方をしたのに、他の分野で全く異なる解釈をされ、驚かれた経験がある...
HPC

ロボットアームの強化学習に挑戦

 今回は、OpenAIが公開しているロボットアームの強化学習に挑戦します。ロボットアームの強化学習は、ロボットアームで物体を挟んだり押したりして動かすFetchと、人の手を模したロボットを動作させるShadowHandがあります。その中から、FetchPickAndPlace、HandManipulateBlockRotateXYZ、HandManipulateBlockFullの強化学習に挑戦してみました。 強化学習  強化学習とは、簡単に説明すると、まず、あるモデルを元にシミュレーションをします。次に、シミュレーションの結果を元にモデルを学習します。その学習したモデルを使って、またシミ...
HPC

DGX H100は何が変わったのか?

はじめに この記事では、DGX H100について、背面図とブロックダイアグラムに着目した解説を行います。DGX A100と比較すると、DGX H100では規格が変更されたポートが導入されたり、安定した通信帯域の確保や高速なGPU間通信を実現するための工夫が凝らされています。DGX H100導入にあたっての参考にしていただけると幸いです。 背面図 まずは、サーバーの背面について、DGX A100とDGX H100を比較し、これまでの構成とどう変わったかを見ていきましょう。 上の図はDGX A100、下の図はDGX H100です。DGX製品に限らず、大規模な深層学習を実施するためのサー...
HPC

[要点を掴む] CUDAアプリの動かし方

CUDAってどんなもの? 『CUDA』は、NVIDIA社のGPUをグラフィック処理以外の汎用の計算用途に使えるようにするための、統合開発環境(コンパイラ等)とランタイムライブラリの集合です。 GPUの内部アーキテクチャは、CPUよりもコア数・スレッド数が大変多い構造になっています(数千スレッド~)。また、GPU上の処理を記述するには、CUDAが登場するより前には、 シェーディング言語といったグラフィック処理専用のプログラミング言語を使いこなす必要がありました。 こうした状況に対し、NVIDIA社はGPUのポテンシャルを簡単に引き出せるようにするべく、CUDAを提供してきました。CUDA環...
HPC

NVLink BridgeでGPUを繋いでも1GPUにはなりません

『NVLink Bridgeで複数GPUを繋いだら、それらが1GPUとして扱えるようになるんでしょ?』という誤解をされているお客様をしばしばお見受けいたします。こちらの記事では、それが誤解であること、また、SLIやUnified Memoryといった関連する情報についても整理して解説いたします。間違った期待を抱いて失敗しないように、正しい理解を深めていきましょう。 GPUのメモリ空間は他デバイスから隔絶されています GPU上には演算するためのプロセッサと、データを一時的に置いておくためのメモリ(VRAM)が搭載されています。GPUのメモリを、CUDAで書かれたプログラムから利用するには、c...