# Fat-Tree
## 定義
Fat-Tree は、上位階層へ行くほどリンク帯域または並列経路を太くして、リーフ間通信のボトルネックを避けるデータセンターネットワークトポロジである。AI/HPC クラスタでは GPU ノード間の all-to-all / all-reduce 通信を支える基盤として、Clos 型 fabric や rail-optimized topology と併用される。
## 横断的知見
- [[Hawkeye]] は K=4 Fat-Tree(20 スイッチ)を評価環境に使い、PFC provenance graph による RDMA 異常診断を示した。([[@2025__SIGCOMM__Hawkeye - Diagnosing RDMA Network Performance Anomalies with PFC Provenance]])
- [[SAKURAONE]] は open Ethernet/RoCEv2 で rail-optimized leaf-spine を構成し、Fat-Tree/Clos 系の多経路設計を AI HPC へ適用する実例を与える。([[@2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]])
- LLM 訓練では物理トポロジが並列化配分と直接結びつく。pipeline parallelism が pod を跨ぐと通信比率が上がり、MFU が低下する。
## 未解決の問い
- Fat-Tree 上の RDMA/PFC 異常診断は、評価用 K=4 より大きい多テナント fabric で線速を保てるか。
- AI 訓練の並列化構成(TP/PP/DP/EP)に対し、Fat-Tree、rail-only、dragonfly、torus のどれが最も扱いやすいか。
## 関連
- 概念: [[RDMA]] / [[オープンネットワーキング]] / [[RDMAネットワーク監視]] / [[LLM分散学習]] / [[並列化戦略]]
- ソース: [[@2025__SIGCOMM__Hawkeye - Diagnosing RDMA Network Performance Anomalies with PFC Provenance]] / [[@2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]]
## 出典
- [[@2025__SIGCOMM__Hawkeye - Diagnosing RDMA Network Performance Anomalies with PFC Provenance]]
- [[@2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]]