# Weihao Cui
[[Shanghai Jiao Tong University]] / [[National University of Singapore]] 所属。[[@2025__arXiv__XPUTimer - Anomaly Diagnostics for Divergent LLM Training in GPU Clusters of Thousand-Plus Scale|Flare(旧 XPUTimer)]] の筆頭著者(Ji Zhang と equal contribution)。Ant Group の 6,000 GPU クラスタ向けに、性能回帰まで自動診断する全スタック異常診断フレームワークを設計した。
## 関連
- ソース: [[@2025__arXiv__XPUTimer - Anomaly Diagnostics for Divergent LLM Training in GPU Clusters of Thousand-Plus Scale]]
- 所属: [[Shanghai Jiao Tong University]] / [[National University of Singapore]]
- 共著者: [[Ji Zhang]] / [[Han Zhao]] / [[Chao Liu]] / [[Jian Sha]] / [[Bingsheng He]] / [[Minyi Guo]] / [[Quan Chen]]