# Jianbo Dong
[[Alibaba Group|Alibaba Cloud]] 所属。[[@2025__NSDI__Evolution of Aegis - Fault Diagnosis for AI Model Training Service in Production]](NSDI 2025)の筆頭著者(equal contribution の 3 名の先頭)。AI モデル訓練クラウド向けの障害診断システム [[Aegis]] の設計・進化を手がける。
- [[@2025__HPCA__Enhancing Large-Scale AI Training Efficiency - The C4 Solution for Real-Time Anomaly Detection and Communication Optimization]](HPCA 2025)の筆頭著者。集約通信のリアルタイム異常検知・通信最適化システム [[C4]]([[C4D]]/[[C4P]])を提案。
## 関連
- ソース: [[@2025__NSDI__Evolution of Aegis - Fault Diagnosis for AI Model Training Service in Production]] / [[@2025__HPCA__Enhancing Large-Scale AI Training Efficiency - The C4 Solution for Real-Time Anomaly Detection and Communication Optimization]]
- 所属: [[Alibaba Group|Alibaba Cloud]]
- 関連システム: [[Aegis]] / [[C4]]
- 共著者: [[Kun Qian]] / [[Ennan Zhai]]