Manya Ghobadi - yuuk1's Digital Garden

# Manya Ghobadi マサチューセッツ工科大学(MIT)の准教授。ネットワークシステム、特に大規模 AI/ML クラスタの通信インフラと光学ネットワークを研究する。SIP-ML(SIGCOMM 2021、光ネットワーク相互接続)や Cassini など ML クラスタのネットワーク性能に関する研究を複数発表している。 ## 主要業績 - **Rail-only**(arXiv 2307.12169, v5 2024): LLM 訓練のスパース通信パターンを分析しスパイン層を除去した低コスト高性能ネットワークアーキテクチャを提案。コスト 38〜77%・消費電力 37〜75% 削減を達成。[[Weiyang Wang]] との共同研究。([[@2023__arXiv__Rail-only - A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters]]) - [[Cassini]]: ML クラスタ向けネットワーク対応ジョブスケジューラ。通信位相の幾何抽象化と Affinity グラフによる互換性スコア最適化を提案。NSDI 2024 で発表([[@2024__NSDI__Cassini Network-Aware Job Scheduling in Machine Learning Clusters]]) - SIP-ML(SIGCOMM 2021): 機械学習訓練向けの高帯域幅光ネットワーク相互接続設計(Khani ほかとの共著) - TopoOpt(NSDI 2023): ネットワークトポロジと並列化戦略の共最適化(Wang ほかとの共著) ## 所属 [[MIT|Massachusetts Institute of Technology]] (MIT) CSAIL, EECS 学科 ## 関連 - ソース: [[@2024__NSDI__Cassini Network-Aware Job Scheduling in Machine Learning Clusters]] / [[@2023__arXiv__Rail-only - A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters]] - エンティティ: [[Weiyang Wang]] / [[Sudarsanan Rajasekaran]] / [[Aditya Akella]] / [[Cassini]] - 概念: [[ネットワーク対応スケジューリング]] / [[GPUクラスタスケジューリング]] / [[LLM分散学習]] / [[Fat-Tree]]