# ATLAHS
ETH Zürich SPCL(Scalable Parallel Computing Lab、[[Torsten Hoefler]] 主宰)が開発するアプリケーション追跡駆動型ネットワークシミュレーションツールチェーン(An Application-centric network simulator Toolchain for AI, HPC, And distributed Storage)。
[[NCCL]] の通信チャネル・プロトコル・パイプライン処理モードの詳細解析([[@2025__IEEE__Demystifying NCCL - An In-depth Analysis of GPU Communication Protocols and Algorithms]])を基盤として、集団通信を計算・送信・受信イベントの細粒度に分解し GOAL スケジュール生成プロセスに組み込む。パイプライン型(Tree/Broadcast/Reduce)と非パイプライン型(Ring AllReduce/AllGather/ReduceScatter)の区別を忠実にモデル化することで、大規模マルチ GPU 環境でのランタイム予測精度を向上させ、AstraSim 等の先行シミュレーターと比較して誤差 5% 未満を達成する。
論文 [6] として参照される: Shen, Bonato, Hu, Jordan, Chen, Hoefler, "ATLAHS: An application-centric network simulator toolchain for AI, HPC, and distributed storage," 2025。
## 関連
- ソース: [[@2025__IEEE__Demystifying NCCL - An In-depth Analysis of GPU Communication Protocols and Algorithms]]
- エンティティ: [[NCCL]] / [[Torsten Hoefler]] / [[ETH Zürich]] / [[Siyuan Shen]] / [[Zhiyi Hu]]
- 概念: [[集合通信]]