# LogPilot
[[The Chinese University of Hong Kong]] の [[Michael R. Lyu]] グループと [[ByteDance]] が開発した、ログベースのアラート診断を自動化する intent-aware かつスケーラブルな LLM フレームワーク。著者らは「大規模オンラインサービスにおけるログベースのアラート診断を自動化する初の intent-aware かつスケーラブルな LLM フレームワーク」と位置づける。(Source: [[@2025__ASE__LogPilot - Intent-aware and Scalable Alert Diagnosis for Large-scale Online Service Systems]])
## 構成(3 フェーズ)
1. **Intent-Aware Log Scoping**: alert-log correlation(ALC)agent がアラートの PromQL の意味的意図を解釈し、アラートごとに軽量なログフィルタリングツール(DSL クエリ付き Python スクリプト)を生成。tool generation → feedback による refinement(最大 3 反復・alignment check)→ tool caching(同一 PromQL は再利用)で因果的に関連する request ID を抽出。
2. **Request-Centric Log Processing**: two-tier log parsing(logging path で粗くクラスタリング → [[ログ解析|Drain]] で構造化)し、request ID で全コンポーネントのログを集めて重複除去・時系列ソート・コンポーネント分割した spatiotemporal log event chain を構築。
3. **Clustering-Based LLM Diagnosis**: 各 request を log event の出現回数ベクトル(対数スケール cosine 類似度)で埋め込み、HAC($\theta_{HAC}=0.7$)でクラスタリング。各クラスタの centroid 最近傍の代表 request だけを log-based request RCA agent が診断し、diagnostic result summary agent が全クラスタ結果を集約 + SOP の RAG で suggestion 生成 + ログ品質 feedback。
## 主要数値
- LLM backend は [[Volcano Engine]] の Doubao シリーズ(ALC/RCA は Doubao-Seed-1.6-thinking、summary は Doubao-Seed-1.6-flash)。
- 評価(Volcano Engine の 4 サービス・202 アラート・161 URC): 要約 Usefulness を RCACopilot 比 +50.34%、localization Exact Match を RCA Agent 比 +54.79%。
- 効率: E2E 58.6 秒、クラスタリングで LLM 呼び出しを平均 198.65 request → 最大 13(平均 2.56)に削減(98.71% 削減)、$0.074/アラート。
- デプロイ: 2025-06 以降 Volcano Engine Cloud の 12 本番サービス、2025-07-31 までに 3,500+ アラート分析、受容率 84.21%。
## 関連
- ソース: [[@2025__ASE__LogPilot - Intent-aware and Scalable Alert Diagnosis for Large-scale Online Service Systems]]
- 開発: [[The Chinese University of Hong Kong]] / [[ByteDance]]
- 関連研究者: [[Zhihan Jiang]] / [[Michael R. Lyu]] / [[Tieying Zhang]]
- プラットフォーム: [[Volcano Engine]](Doubao LLM・本番デプロイ先・データ出所)
- 概念: [[ログ解析]] / [[根本原因分析]] / [[Fault Localization]] / [[異常検知]] / [[AIOps]]