# Michael R. Lyu
[[The Chinese University of Hong Kong]] の教授(メール
[email protected])。[[LogPilot]] のシニア著者。(Source: [[@2025__ASE__LogPilot - Intent-aware and Scalable Alert Diagnosis for Large-scale Online Service Systems]])
[[Cloud-OpsBench]](arXiv 2026)にも共著者として参加する(Source: [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]])。[[LLMPrism]](DSN 2025、Huawei Cloud との共同研究)のシニア著者でもあり、研究領域が LLM 訓練プラットフォームの性能診断にも及ぶ。(Source: [[@2025__DSN__LLMPrism - Black-box Performance Diagnosis for Production LLM Training Platforms]])。ソフトウェア信頼性工学・ログ解析・AIOps の長年の牽引者で、ログ解析の二大ハブの一つを成す(もう一方は [[Tsinghua University]] の [[Dan Pei]] グループ)。LogPilot の参考文献に現れる本グループ由来の研究は広範で、オンラインログ parsing の基盤手法 Drain(ICWS 2017)、LLM ベースのログ parsing LILAC(FSE 2024)・無教師ログ parser(FSE 2025)、ログ解析の信頼性工学サーベイ(ACM Comput. Surv. 2022)、分散システムのコード知識を使う生成的 RCA の COCA(ICSE 2025)、LLM 訓練障害をログから診断する L4(FSE Companion 2025)などがある。学生・共同研究者に [[Zhihan Jiang]] らが連なる。
[[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis|L4]](FSE Companion '24 / arXiv 2503.20263)の最終著者(シニア著者)。筆頭の [[Zhihan Jiang]]・責任著者の [[Guangba Yu]] らと、Platform-X の LLM 訓練障害のログベース自動診断を主導する。(Source: [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis]])
## 関連
- ソース: [[@2025__ASE__LogPilot - Intent-aware and Scalable Alert Diagnosis for Large-scale Online Service Systems]] / [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]] / [[@2025__DSN__LLMPrism - Black-box Performance Diagnosis for Production LLM Training Platforms]] / [[@2025__ESEC-FSE__L4 - Diagnosing Large-scale LLM Training Failures via Automated Log Analysis]]
- 所属: [[The Chinese University of Hong Kong]]
- 関連研究者: [[Zhihan Jiang]] / [[Tieying Zhang]] / [[Dan Pei]](ログ解析のもう一方のハブ)
- 関連プロダクト: [[LogPilot]]
- 概念: [[ログ解析]] / [[根本原因分析]] / [[AIOps]]