Vista - yuuk1's Digital Garden

# Vista TACC(Texas Advanced Computing Center)が運用するスパコン。GPUPerf の評価テストベッドの一つ。(Source: [[@2025__arXiv__Efficient Fine-Grained GPU Performance Modeling for Distributed Deep Learning of LLM]]) - 構成: NVIDIA Grace CPU Superchip + GH200(96GB HBM3)、1 GPU/ノード、ノード内 NVLink-C2C(900 GB/s)、ノード間 NVIDIA NDR InfiniBand(400 Gb/s)、最大 128 ノード(128 GH200)。 - GPUPerf は単一 GPU/ノードの統合メモリ(GH200 + InfiniBand)というハードウェアパラダイムを代表する環境として用い、平均予測誤差 **9.38%**(一貫した過小評価傾向)。全通信がノード間 InfiniBand を通るためネットワークジッタ・輻輳に脆弱で、対照の [[Perlmutter]] より誤差・変動が大きい。 - 注: 論文の表V の見出しは「H200-96GB HBM3」と表記し本文の GH200 と表記ゆれがあるが、本文・abstract に従い GH200 として扱う。 ## 関連 - ソース: [[@2025__arXiv__Efficient Fine-Grained GPU Performance Modeling for Distributed Deep Learning of LLM]] - 対照テストベッド: [[Perlmutter]] - 概念: [[LLM分散学習]] / [[GPUクラスタ運用]] / [[並列化戦略]]