# Sun Yat-sen University 広州の研究大学(SYSU、中山大学)。[[Pengfei Chen]] グループが AIOps・マイクロサービス信頼性・根本原因分析の研究を牽引する。(Source: [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]]) - [[Cloud-OpsBench]] では SYSU 側として Zirui Wang・[[Pengfei Chen]] が参加し、[[The Chinese University of Hong Kong]] と共同で開発した。 - 本論文の参考文献からは、同グループ由来の AIOps 研究が広範に連なる(MicroRank・Nezha・ChangeRCA・SwissLog・MicroSketch・FaaSRCA など、多くで [[Guangba Yu]]・[[Pengfei Chen]] が共著)。 - [[AlertGuardian]](ASE 2025)では [[Guangba Yu]]・Genting Mai・[[Pengfei Chen]](corresponding author)が SYSU 側として参加し、[[Tencent]] と共同でアラートライフサイクル管理フレームワークを開発した。(Source: [[@2025__ASE__AlertGuardian - Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems]]) - [[eACGM]](IWQoS 2025)は [[Ruilin Xu]]・[[Zongxuan Xie]]・[[Pengfei Chen]] による SYSU 単独の研究で、eBPF + libnvml + GMM のフルスタック非侵入 ML システム監視・異常検知フレームワークを開発した。(Source: [[@2025__IWQoS__eACGM - Non-instrumented Performance Tracing and Anomaly Detection towards Machine Learning Systems]]) - [[L4]](FSE 2025)では [[Zhuangbin Chen]]([[Sun Yat-sen University]] Zhuhai)が SYSU 側として参加し、[[The Chinese University of Hong Kong]]・[[Huawei Cloud]] と共同で LLM 訓練障害のログ解析診断フレームワークを開発した。(Source: [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis]]) - [[Tracezip]](ISSTA 2025)は [[Zhuangbin Chen]](筆頭著者)・[[Zibin Zheng]](corresponding author)による SYSU School of Software Engineering(珠海)の研究で、分散トレースのオンライン圧縮システムを [[OpenTelemetry]] Collector 内に実装した。(Source: [[@2025__ISSTA__Tracezip - Efficient Distributed Tracing via Trace Compression]]) - [[Mint]](ASPLOS 2025)では Haiyu Huang・[[Guangba Yu]]・Zilong He・Yilun Wang・[[Pengfei Chen]](corresponding author)が SYSU 側として参加し、[[Alibaba Group]] と共同でコスト効率的な分散トレーシングフレームワークを開発した。(Source: [[@2025__ASPLOS__Mint - Cost-Efficient Tracing with All Requests Collection via Commonality and Variability Analysis]]) - [[LogReducer]](ICSE 2023)では [[Guangba Yu]](筆頭著者)・[[Pengfei Chen]](corresponding author)・Zibin Zheng が SYSU 側として参加し、[[Tencent]] と共同で eBPF ベースのログホットスポット削減フレームワークを開発した。[[WeChat]] 本番に導入しストレージ 39.08% 削減を達成。(Source: [[@2023__ICSE__LogReducer - Identify and Reduce Log Hotspots in Kernel on the Fly]]) ## 関連 - 本ソース: [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]] / [[@2025__ASE__AlertGuardian - Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems]] / [[@2025__IWQoS__eACGM - Non-instrumented Performance Tracing and Anomaly Detection towards Machine Learning Systems]] / [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis]] / [[@2025__ASPLOS__Mint - Cost-Efficient Tracing with All Requests Collection via Commonality and Variability Analysis]] / [[@2023__ICSE__LogReducer - Identify and Reduce Log Hotspots in Kernel on the Fly]] - 所属研究者: [[Pengfei Chen]] / [[Guangba Yu]] / [[Ruilin Xu]] / [[Zongxuan Xie]] / [[Zhuangbin Chen]] - 共同研究先: [[The Chinese University of Hong Kong]] / [[Tencent]] / [[Huawei Cloud]] - 関連プロダクト: [[Cloud-OpsBench]] / [[AlertGuardian]] / [[eACGM]] / [[L4]] / [[Tracezip]] / [[Mint]] / [[LogReducer]] - 関連概念: [[根本原因分析]] / [[AIOps]] / [[異常検知]] / [[ログ解析]] / [[分散トレーシング]]