# Guangba Yu [[Sun Yat-sen University]](広州)の研究者で、[[AlertGuardian]](ASE 2025)の筆頭著者。(Source: [[@2025__ASE__AlertGuardian - Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems]]) [[Pengfei Chen]] グループの一員として、AIOps・マイクロサービス信頼性・障害箇所特定/根本原因分析を中心に研究する。AlertGuardian の参考文献に現れる本人主導・共著の研究は広く、マルチモーダルオブザーバビリティデータでの細粒度 RCA「Nezha」(ESEC/FSE 2023)、スペクトル解析による遅延障害箇所特定「MicroRank」(WWW 2021)、ソフトウェア変更からの RCA「ChangeRCA」(FSE 2024)、コスト効率のマイクロサービススケーリング「Microscaler」、カーネルのログホットスポット削減「LogReducer」(ICSE 2023)、クラウド障害ライフサイクルのガイドライン(ISSRE 2022)などがある。 [[Cloud-OpsBench]](arXiv 2026)では責任著者(corresponding author)を務める。同論文の著者連絡先では所属が [[The Chinese University of Hong Kong]]([email protected])と記される。(Source: [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]]) [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis|L4]](FSE Companion '24 / arXiv 2503.20263)では責任著者(corresponding author)を務め、[[The Chinese University of Hong Kong]] 所属として登場する。LLM 訓練障害のログベース診断という、従来のマイクロサービス/クラウド RCA から LLM 訓練インフラへ研究関心が広がっていることを示す。(Source: [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis]]) [[LLMPrism]](DSN 2025)の共著者でもあり、CUHK 所属として登場する。L4(ログベース)に続き、ネットワークフローベースの LLM 訓練性能診断にも関与し、LLM 訓練プラットフォームの可観測性へ研究を広げている。(Source: [[@2025__DSN__LLMPrism - Black-box Performance Diagnosis for Production LLM Training Platforms]]) [[Mint]](ASPLOS 2025)の共著者でもあり、[[Sun Yat-sen University]] 所属として登場する。SYSU 時代の [[Pengfei Chen]] グループでの分散トレーシング研究。(Source: [[@2025__ASPLOS__Mint - Cost-Efficient Tracing with All Requests Collection via Commonality and Variability Analysis]]) [[TraStrainer]](ESEC/FSE 2024)の共著者でもあり、[[Sun Yat-sen University]] 所属として登場する。システムランタイム状態を考慮した適応的トレースサンプリング。(Source: [[@2024__FSE__TraStrainer - Adaptive Sampling for Distributed Traces with System Runtime State]]) > [!contradiction] 所属表記の食い違い > AlertGuardian(ASE 2025)では [[Sun Yat-sen University]] 所属として登場するが、Cloud-OpsBench(arXiv 2026)では [[The Chinese University of Hong Kong]]([email protected])所属・責任著者と記される。所属の移籍・併任の可能性があり、いずれも出典どおりに保持する。 ## 関連 - ソース: [[@2024__FSE__TraStrainer - Adaptive Sampling for Distributed Traces with System Runtime State]] / [[@2025__ASE__AlertGuardian - Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems]] / [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]] / [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis]] / [[@2023__ICSE__LogReducer - Identify and Reduce Log Hotspots in Kernel on the Fly]] / [[@2025__ASPLOS__Mint - Cost-Efficient Tracing with All Requests Collection via Commonality and Variability Analysis]] - 所属: [[Sun Yat-sen University]](AlertGuardian) / [[The Chinese University of Hong Kong]](Cloud-OpsBench, L4) - 共同研究者: [[Pengfei Chen]] / [[Michael R. Lyu]] - 関連プロダクト: [[AlertGuardian]] / [[Cloud-OpsBench]] / [[LogReducer]] / [[Mint]] / [[TraStrainer]] - 概念: [[AIOps]] / [[根本原因分析]] / [[異常検知]] / [[ログ解析]] / [[eBPF]] / [[分散トレーシング]]