# Pengcheng Zhang
[[Alibaba Group|Alibaba Cloud]] 所属。[[@2025__NSDI__Evolution of Aegis - Fault Diagnosis for AI Model Training Service in Production]](NSDI 2025)の筆頭著者(equal contribution の 3 名の一人)。AI モデル訓練クラウド向けの障害診断システム [[Aegis]] の設計・進化を手がける。
- 参照には Pengcheng Zhang を共著者とする Alibaba HPN(SIGCOMM 2024 [45])・Flow event telemetry([63])など Alibaba Cloud のデータセンターネットワーク系研究が含まれる。
## 関連
- ソース: [[@2025__NSDI__Evolution of Aegis - Fault Diagnosis for AI Model Training Service in Production]] / [[@2026__NSDI__EROICA - Online Performance Troubleshooting for Large-scale Model Training]]
- 所属: [[Alibaba Group|Alibaba Cloud]]
- 関連システム: [[Aegis]]
- 共著者: [[Jianbo Dong]] / [[Kun Qian]] / [[Ennan Zhai]]