# ATLAHS ETH Zürich SPCL(Scalable Parallel Computing Lab、[[Torsten Hoefler]] 主宰)が開発するアプリケーション追跡駆動型ネットワークシミュレーションツールチェーン(An Application-centric network simulator Toolchain for AI, HPC, And distributed Storage)。 [[NCCL]] の通信チャネル・プロトコル・パイプライン処理モードの詳細解析([[@2025__IEEE__Demystifying NCCL - An In-depth Analysis of GPU Communication Protocols and Algorithms]])を基盤として、集団通信を計算・送信・受信イベントの細粒度に分解し GOAL スケジュール生成プロセスに組み込む。パイプライン型(Tree/Broadcast/Reduce)と非パイプライン型(Ring AllReduce/AllGather/ReduceScatter)の区別を忠実にモデル化することで、大規模マルチ GPU 環境でのランタイム予測精度を向上させ、AstraSim 等の先行シミュレーターと比較して誤差 5% 未満を達成する。 論文 [6] として参照される: Shen, Bonato, Hu, Jordan, Chen, Hoefler, "ATLAHS: An application-centric network simulator toolchain for AI, HPC, and distributed storage," 2025。 ## 関連 - ソース: [[@2025__IEEE__Demystifying NCCL - An In-depth Analysis of GPU Communication Protocols and Algorithms]] - エンティティ: [[NCCL]] / [[Torsten Hoefler]] / [[ETH Zürich]] / [[Siyuan Shen]] / [[Zhiyi Hu]] - 概念: [[集合通信]]