# 仮説駆動RCA
## 定義
仮説駆動RCAは、障害症状から複数の原因仮説を立て、限定された証拠で検証・棄却・再定式化しながら根本原因へ近づく RCA の調査スタイルである。LLM エージェントに全テレメトリを要約させる設計ではなく、人間 SRE のトラブルシューティング手順をエージェントの制御ループとして実装する。
## 横断的知見
- SRE Book の Effective Troubleshooting は、トラブルシューティングを仮説演繹法・分割統治・安定化優先として体系化した。これは agentic SRE の仮説駆動調査の前史である。([[@2016__OReilly__SRE Book - Chapter 12 Effective Troubleshooting]])
- [[Bits AI SRE]] は全テレメトリの一括要約から、因果的つながりを辿る hypothesis-driven investigation へ設計を移した。([[@2026__Datadog__Building Bits AI SRE - Autonomous Incident Investigation Agent]])
- [[SREGym]] は、多くのエージェントが最初のもっともらしい異常に固着し、競合仮説を作らないと報告する。仮説駆動を名乗るには、仮説生成だけでなく並行検証と停止条件が必要である。([[@2026__arXiv__SREGym - A Live Benchmark for AI SRE Agents with High-Fidelity Failure Scenarios]])
- [[Cloud-OpsBench]] や agentic NetOps/AIOps サーベイは、調査軌跡を予算・停止規則・証拠 citation で制御する必要を示す。仮説駆動 RCA は推論技法だけでなく制御問題である。([[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]], [[@2026__arXiv__Large Language Models for Agentic NetOps and AIOps - Architectures, Evaluation, and Safety]])
## 未解決の問い
- 複数仮説をどの粒度で保持し、どの証拠で棄却済みとみなすべきか。
- 深掘りの停止条件は、証拠充足、予算、矛盾観測、緩和可能性のどれで決めるべきか。
- 仮説駆動 RCA が「もっともらしい物語」へ流れる story mode を、tool citation と contradiction check でどこまで防げるか。
## 関連
- 親: [[根本原因分析]]
- 概念: [[agentic SRE]] / [[SRE]] / [[障害緩和]] / [[エージェント運用安全性]]
- ソース: [[@2016__OReilly__SRE Book - Chapter 12 Effective Troubleshooting]] / [[@2026__Datadog__Building Bits AI SRE - Autonomous Incident Investigation Agent]] / [[@2026__arXiv__SREGym - A Live Benchmark for AI SRE Agents with High-Fidelity Failure Scenarios]] / [[@2026__arXiv__Large Language Models for Agentic NetOps and AIOps - Architectures, Evaluation, and Safety]]
## 出典
- [[@2016__OReilly__SRE Book - Chapter 12 Effective Troubleshooting]]
- [[@2026__Datadog__Building Bits AI SRE - Autonomous Incident Investigation Agent]]
- [[@2026__arXiv__SREGym - A Live Benchmark for AI SRE Agents with High-Fidelity Failure Scenarios]]
- [[@2026__arXiv__Cloud-OpsBench - A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems]]
- [[@2026__arXiv__Large Language Models for Agentic NetOps and AIOps - Architectures, Evaluation, and Safety]]