# Weihao Cui [[Shanghai Jiao Tong University]] / [[National University of Singapore]] 所属。[[@2025__arXiv__XPUTimer - Anomaly Diagnostics for Divergent LLM Training in GPU Clusters of Thousand-Plus Scale|Flare(旧 XPUTimer)]] の筆頭著者(Ji Zhang と equal contribution)。Ant Group の 6,000 GPU クラスタ向けに、性能回帰まで自動診断する全スタック異常診断フレームワークを設計した。 ## 関連 - ソース: [[@2025__arXiv__XPUTimer - Anomaly Diagnostics for Divergent LLM Training in GPU Clusters of Thousand-Plus Scale]] - 所属: [[Shanghai Jiao Tong University]] / [[National University of Singapore]] - 共著者: [[Ji Zhang]] / [[Han Zhao]] / [[Chao Liu]] / [[Jian Sha]] / [[Bingsheng He]] / [[Minyi Guo]] / [[Quan Chen]]