COCA - yuuk1's Digital Garden

# COCA **Code knOwledge enhanced root CAuse analysis**。[[The Chinese University of Hong Kong]](CUHK)の [[Guangba Yu]]・[[Michael R. Lyu]] らが提案(arXiv 2025-03-29)した、分散システムのイシューレポートに対するコード知識強化 RCA フレームワーク。 GitHub: https://github.com/YichenLi00/COCA ## 概要既存の LLM ベース RCA はユーザー提出のイシューレポート(JIRA・GitHub Issues)に記載された不完全・曖昧な情報に依存する。COCA は分散システムのソースコードから診断手がかりを抽出することで、この情報不足を補い、より正確な根本原因推論を可能にする。 ## 4 フェーズアーキテクチャ 1. **フェーズ I: ログソース探索(Logging Source Retrieval)** — 静的解析ベースのバックトラッキングでロギング文を原始テンプレートに復元し、前置詞ツリーマッチングでイシューレポートのログメッセージをコード行に対応付ける 2. **フェーズ II: 実行パス再構築(Execution Path Reconstruction)** — ICFG(手続き間制御フローグラフ)とインターメソッド/イントラメソッド解析で障害前の実行パスを再構築。**RPCBridge** が gRPC 等の RPC 呼び出しを IDL ファイル解析でブリッジする(新規貢献) 3. **フェーズ III: 障害関連コードプロファイリング(Failure-related Code Profiling)** — メソッドレベルのインデックス(シグネチャ+ドキュメント)を生成し、LLM がコードスニペットを選択検索できる 2 段階インデックス/検索フレームワーク 4. **フェーズ IV: 根本原因推論(Root Cause Inference)** — BM25 で選んだ過去 5 件のイシューレポートをインコンテキスト学習例として、根本原因要約と根本原因コンポーネントのランク付き箇所特定を LLM で生成 ## 評価 - **データセット**: MapReduce・HDFS・HBase・Cassandra・ZooKeeper の 5 システムから 106 件の実世界イシュー - **結果**: [[RCACopilot]] 比で障害箇所特定(Exact Match)+28.3%・根本原因要約(BLEU-4)+22.0% - **汎化性**: GPT-4o・GPT-3.5・LLaMa-3.1-405b・Claude-3.5-Sonnet・Gemini-1.5-Pro の 5 モデルすべてで一貫した性能向上(Exact Match 平均+43.3%) - **応答時間**: 平均 19.4 秒(専門家の手動分析では数時間〜数日を要する) ## 関連 - 一次論文: [[@2025__arXiv__COCA - Generative Root Cause Analysis for Distributed Systems with Code Knowledge]] - 著者: Yichen Li / Yulun Wu / Jinyang Liu / [[Zhihan Jiang]] / Zhuangbin Chen / [[Guangba Yu]] / [[Michael R. Lyu]] - 比較: [[RCACopilot]] / ReAct - 概念: [[根本原因分析]] / [[LLMによる根本原因分析]] / [[ログ解析]]