# AI Operator ## 概要 [[Google]] の **first-responder agent**。alert シグナルを拡張モジュールで消費し、人間専門家の例(few-shot prompt、text proto にエンコード)に導かれて**並列調査**を実行する。推論は enrichers(決定的シグナル増幅器)・専門 mitigation skill・few-shot prompt から構成される。複雑シナリオでは専門 sub-agent を spawn し、token 使用を厳格管理して context loss を防ぐ。([[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]]) - **稼働レベル**: L2 Autonomy(重要操作は人間レビュー要)と L3 Autonomy(軽微インシデントは安全に自律実行)で稼働中([[SRE AI Autonomy Levels]])。 - **透明性**: Chain of Thought を中央 UI に提示し、各ステップは監査可能。診断失敗時は調査履歴を合成してインシデントプラットフォームに投稿し、即時に人間へエスカレーション。 - **評価**: 全実行トレースを Spanner に保存し、LLM-as-a-Judge が自動 action を Golden Data の人間応答と比較。 - **設計原則**: 推論(本 agent)と actuation([[Actus]])を分離し、安全制御をモデル進化から独立に保つ。 ## 横断比較 - [[Stratus]](学術)が failure detection/diagnosis/mitigation の専門 agent を state machine で編成するのに対し、AI Operator は推論と actuation を別エージェント([[Actus]])に分離する点で「安全境界の置き方」が産業実装らしい。いずれも multi-agent でインシデント対応を自律化する系。 ## 関連 - ソース: [[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]] - 概念: [[SRE AI Autonomy Levels]] / [[agentic SRE]] / [[Transactional No-Regression]] - エンティティ: [[Google]] / [[Actus]] / [[Stratus]] - 関連 MOC: [[LLM4SRE - MOC]] ## 出典 - [[2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]](L3: Autonomous Mitigation)