# SRE AI Autonomy Levels
## 定義
SRE AI Autonomy Levels は、AI エージェントが本番運用に関与する自律度を **L0(全手動)〜 L4(完全自律)** の 5 段階で定義する Google の統治フレームワーク。自動車の運転自動化レベルに着想を得て、インシデント対応を 5 つの軸 ── Monitor(監視)/ Investigate(調査)/ Mitigate(緩和判断)/ Actuate(実行)/ Self-Direct(自己統御)── に分解し、各軸が Human から Auto へ移る度合いでレベルを決める。各レベルへの昇格は「実証された信頼性」に紐づく([[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]])。
| Level | Monitor | Investigate | Mitigate | Actuate | Self-Direct |
|-------|---------|-------------|----------|---------|-------------|
| L0 | Human | Human | Human | Human | Manual |
| L1 | Auto | Auto | Human | Human | Assisted |
| L2 | Auto | Auto | Human | Auto | Partial |
| L3 | Auto | Auto | Auto | Auto | High |
| L4 | Auto | Auto | Auto | Auto | Full |
昇格基準(Progressive Authorization):
- **L0→L1**: ツールの可用性と採用。
- **L1→L2**: 信頼できる識別と安全な経路。
- **L2→L3**: 実証された精度・信頼・堅牢な安全制御。
- **L3→L4**: 多段の解決と end-to-end の管理能力。
L2 は「緩和の**判断**は人間がするが**実行**は自動」、L3 は「判断も実行も自動(ただし軽微インシデントに限定)」という区別が肝で、[[Actus]] のような safety gateway による実行の安全化が L2→L3 の前提になる。
## 横断的知見
- **「タスク成功率」の学術系 vs 「自律度の成熟」の産業系**: 学術ベンチ([[AIOpsLab]] の 4-level taxonomy、[[SREGym]] の end-to-end 成功判定)はエージェントが detection/RCA/mitigation を**正しく解けるか**を測る。対して本フレームワークは**どこまで人間を意思決定ループから外せるか**を L0–L4 で測る。前者は能力の縦軸、後者は権限委譲の縦軸で、評価している対象が直交する。(Source: [[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]], [[2025__MLSys2025__AIOpsLab - A Holistic Framework to Evaluate AI Agents for Enabling Autonomous Clouds]])
- **自律度の前提は安全工学**: L2→L3(緩和判断の自動化)を可能にするのは精度向上だけでなく「堅牢な安全制御」── dry-run・Red Button・[[Actus]] による委譲 actuation。これは [[Stratus]] が形式化した安全仕様 [[Transactional No-Regression]](安全に試して巻き戻せる)と同じ発想で、産業・学術の双方が「自律性は安全に巻き戻せる実行とセットで初めて上げられる」という結論に収束している。(Source: [[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]], [[2025__NeurIPS2025__STRATUS - A Multi-agent System for Autonomous Reliability Engineering of Modern Clouds]])
## 未解決の問い
- L0–L4 は Google の定性的な枠組みで、各レベルへの昇格を判定する**定量基準**(必要な精度・成功実績の量・許容リスク)は本ソースでは未明示。学術ベンチの成功率(例: AIOpsLab の level 別正答率)を昇格基準に写像できるか。
- 「Mitigate は Human だが Actuate は Auto」(L2)という分離は、緩和の**判断**と**実行**を切り離せる前提に立つ。診断と緩和が不可分なインシデント(実行してみないと正しさが分からない)で L2 は成立するか。[[agentic SRE]] の「緩和は実行時にしか結果が観測できない多段計画」という性質と整合するか。
- L3 を「軽微インシデント限定」とする境界(何を軽微とみなすか)は誰がどう決めるか。Real-time Risk Evaluation(同じ操作でも文脈でリスクが変わる)を自律度判定にどう組み込むか。
- 他の自律度フレームワーク(自動運転の SAE レベル、agentic AI 一般の自律度分類)と比較して、SRE 固有の軸(5 軸)はどこまで一般化/特殊化されているか。
## 関連
- ソース: [[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]]
- 概念: [[agentic SRE]] / [[Transactional No-Regression]] / [[AIOps]] / [[SRE Benchmark]]
- エンティティ: [[Google]] / [[AI Operator]] / [[Actus]]
- 関連 MOC: [[LLM4SRE - MOC]] / [[SRE - MOC]] / [[Project AI4SRE - MOC]]
## 出典
- [[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]](SRE AI Autonomy Levels, Governing AI in Production Operations)