RockportNetworks Durham Universityの導入事例の抄訳

この記事は、RockportNetworks社のBlogで紹介されているDurham University Explores a Better Way to Chart the Cosmosの抄訳です。

英国ダラム大学の計算宇宙論研究所（ICC）では、スーパーコンピュータ「COSMA」がビッグバン以降の宇宙論シミュレーションを実行し、約1300億個の粒子と1ペタバイト以上のデータを生成しています。

惑星形成からブラックホールまでのシミュレーションは、数ヶ月に及ぶこともあります。望遠鏡による観測データと比較することで、宇宙の進化と構造についてより完全な姿を明らかにすることができます。

このようなエクサスケールモデリングでは、大量のコンピュート（計算量）を消費します。しかし，ノード間を接続し，クラスタ内をデータが流れる際のノード間トラフィックを管理するために，高速かつ超低遅延の高性能ネットワークも必要になります。

シミュレーションのある部分のデータは、別のデータセットに依存して更新されるため、ある星に変更を加えると、他の星にも影響を及ぼします。

正確性を確保するためには、メッセージはできるだけ早く、かつ予測可能な形で、モデル全体に行き渡るようにする必要があります。

限界点における輻輳状況

エキサスケールシステムの数千のノードでコードを実行する場合、ポートの輻輳とロングテールのレイテンシーが重大な性能問題を引き起こします。

ワークロードの完了時間が遅く、予測できない場合、研究が遅れ、高価な計算機やストレージのリソースが十分に活用されず、コストがかさむ可能性があります。

30年来の集中型スイッチングアーキテクチャは、high switch radix※と、ワークロード規模の拡大に伴う指数関数的なプロセス間通信（IPC）レイテンシの増加により、深刻な制約を受けています。

スイッチング容量を際限なく増やすと配線が複雑になり、運用コストが高くなるため、性能重視のアプリケーションでは集中型スイッチング方式はろくなことがないです。

スケールファブリックがパフォーマンスと経済性を向上させる

輻輳への対策は、スイッチの階層や帯域幅を増やすだけでなく、根本的な原因であるネットワークへの対応に移ってきています。アーキテクチャを分散ファブリックに変更することで、パフォーマンス、リソース利用、ネットワーク経済性の向上を実現します。

COSMAクラスタでは、Rockportスケールファブリックが、ネットワークとなるエンドポイントデバイス（ノード）にネットワークスイッチング機能を分散させます。

その結果、集中型アーキテクチャの15,000秒以上のレイテンシに対して、25ナノ秒のレイテンシを実現しました。

スイッチの階層をなくすことで、計算機やストレージのリソースが不足することがなくなり、研究者はワークロードの完了時間をより予測しやすくなります。

※簡単に言うとスイッチのポート数。

さらにご興味を持たれた方は以下の原文をお読みください。