# Jianbo Dong [[Alibaba Group|Alibaba Cloud]] 所属。[[@2025__NSDI__Evolution of Aegis - Fault Diagnosis for AI Model Training Service in Production]](NSDI 2025)の筆頭著者(equal contribution の 3 名の先頭)。AI モデル訓練クラウド向けの障害診断システム [[Aegis]] の設計・進化を手がける。 - [[@2025__HPCA__Enhancing Large-Scale AI Training Efficiency - The C4 Solution for Real-Time Anomaly Detection and Communication Optimization]](HPCA 2025)の筆頭著者。集約通信のリアルタイム異常検知・通信最適化システム [[C4]]([[C4D]]/[[C4P]])を提案。 ## 関連 - ソース: [[@2025__NSDI__Evolution of Aegis - Fault Diagnosis for AI Model Training Service in Production]] / [[@2025__HPCA__Enhancing Large-Scale AI Training Efficiency - The C4 Solution for Real-Time Anomaly Detection and Communication Optimization]] - 所属: [[Alibaba Group|Alibaba Cloud]] - 関連システム: [[Aegis]] / [[C4]] - 共著者: [[Kun Qian]] / [[Ennan Zhai]]