# Dan Pei [[Tsinghua University]] & BNRist 所属の教授。クラウドサービスの異常検知・根本原因分析・インシデント管理の研究グループ NetManAIOps を主宰する。 - AIOps の基盤的な研究を長年にわたり牽引。本 wiki の [[MonitorAssistant]] のほか、Opprentice(IMC 2015)、OmniAnomaly(KDD 2019)、InterFusion(KDD 2021)、ImDiffusion(VLDB 2023)、Robust Multimodal Failure Detection(KDD 2023)等の異常検知研究、TraceDiag(ESEC/FSE 2023)の分散トレーシング解析など広範な出版を持つ。 - [[Microsoft]] の [[Minghua Ma]]・Qingwei Lin・Dongmei Zhang らと密接に共同研究。MonitorAssistant の参考文献の多くが Dan Pei グループの産物である。 - 学生の [[Zhaoyang Yu]] は異常検知・RCA に注力。 - [[OpenRCA]] 論文([[@2025__ICLR__OpenRCA - Can Large Language Models Locate the Root Cause of Software Failures]], ICLR 2025)に共著者として参加([email protected])。[[Microsoft]] の [[Shilin He]]・[[Qingwei Lin]]・[[Chaoyun Zhang]] と [[The Chinese University of Hong Kong, Shenzhen]] の [[Pinjia He]] グループとの共同で、LLM の RCA ベンチマークを構築した。(Source: [[@2025__ICLR__OpenRCA - Can Large Language Models Locate the Root Cause of Software Failures]]) - [[Flow-of-Action]] 論文([[@2025__WWW__Flow-of-Action - SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis]], WWW Companion '25)に共著者として参加。CNIC/CAS の [[Changhua Pei]] と [[ByteDance]] の [[Tieying Zhang]] らとの共同で、SOP 強化型マルチエージェント RCA システムを構築した。(Source: [[@2025__WWW__Flow-of-Action - SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis]]) - [[SCELM]] 論文([[@2025__FSE Companion__A Multimodal Intelligent Change Assessment Framework for Microservice Systems Based on Large Language Models]], FSE Companion '25)に共著者として参加。[[Nankai University]] の [[Yongqian Sun]]・[[Shenglin Zhang]] らとの共同で、ECD・FT・RCCA 統合変更管理フレームワークを構築した。(Source: [[@2025__FSE Companion__A Multimodal Intelligent Change Assessment Framework for Microservice Systems Based on Large Language Models]]) ## 関連 - ソース: [[@2024__ESEC-FSE__MonitorAssistant - Simplifying Cloud Service Monitoring via Large Language Models]] / [[@2025__ICLR__OpenRCA - Can Large Language Models Locate the Root Cause of Software Failures]] / [[@2025__WWW__Flow-of-Action - SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis]] / [[@2025__FSE Companion__A Multimodal Intelligent Change Assessment Framework for Microservice Systems Based on Large Language Models]] / [[@2025__KDD__FlowXpert - Expertizing Troubleshooting Workflow Orchestration with Knowledge Base and Multi-Agent Coevolution]] / [[@2026__ASE__OpsAgent - An Evolving Multi-agent System for Incident Management in Microservices]] - 所属: [[Tsinghua University]] - 関連研究者: [[Minghua Ma]] / [[Zhaoyang Yu]] / [[Changhua Pei]] / Qingwei Lin / [[Shenglin Zhang]] / [[Yongqian Sun]] - 関連プロダクト: [[MonitorAssistant]] / [[SCELM]] - 概念: [[異常検知]] / [[AIOps]] / [[根本原因分析]] / [[ソフトウェア変更管理]]