# Manya Ghobadi
マサチューセッツ工科大学(MIT)の准教授。ネットワークシステム、特に大規模 AI/ML クラスタの通信インフラと光学ネットワークを研究する。SIP-ML(SIGCOMM 2021、光ネットワーク相互接続)や Cassini など ML クラスタのネットワーク性能に関する研究を複数発表している。
## 主要業績
- **Rail-only**(arXiv 2307.12169, v5 2024): LLM 訓練のスパース通信パターンを分析しスパイン層を除去した低コスト高性能ネットワークアーキテクチャを提案。コスト 38〜77%・消費電力 37〜75% 削減を達成。[[Weiyang Wang]] との共同研究。([[@2023__arXiv__Rail-only - A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters]])
- [[Cassini]]: ML クラスタ向けネットワーク対応ジョブスケジューラ。通信位相の幾何抽象化と Affinity グラフによる互換性スコア最適化を提案。NSDI 2024 で発表([[@2024__NSDI__Cassini Network-Aware Job Scheduling in Machine Learning Clusters]])
- SIP-ML(SIGCOMM 2021): 機械学習訓練向けの高帯域幅光ネットワーク相互接続設計(Khani ほかとの共著)
- TopoOpt(NSDI 2023): ネットワークトポロジと並列化戦略の共最適化(Wang ほかとの共著)
## 所属
[[Massachusetts Institute of Technology]] (MIT) CSAIL, EECS 学科
## 関連
- ソース: [[@2024__NSDI__Cassini Network-Aware Job Scheduling in Machine Learning Clusters]] / [[@2023__arXiv__Rail-only - A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters]]
- エンティティ: [[Weiyang Wang]] / [[Sudarsanan Rajasekaran]] / [[Aditya Akella]] / [[Cassini]]
- 概念: [[ネットワーク対応スケジューリング]] / [[GPUクラスタスケジューリング]] / [[LLM分散学習]] / [[Fat-Tree]]