AI Operator - yuuk1's Digital Garden

# AI Operator ## 概要 [[Google]] の**一次対応エージェント**。アラートシグナルを拡張モジュールで消費し、人間専門家の例(few-shot プロンプト、text proto にエンコード)に導かれて**並列調査**を実行する。推論は enrichers(決定的シグナル増幅器)・専門の緩和スキル・few-shot プロンプトから構成される。複雑なシナリオでは専門のサブエージェントを生成し、トークン使用を厳格に管理してコンテキストの喪失を防ぐ。([[@2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]]) - **稼働レベル**: L2 Autonomy(重要操作は人間のレビューを要する)と L3 Autonomy(軽微なインシデントは安全に自律実行)で稼働中([[SRE AI Autonomy Levels]])。 - **透明性**: Chain of Thought を中央 UI に提示し、各ステップは監査可能。診断失敗時は調査履歴を合成してインシデントプラットフォームに投稿し、即時に人間へエスカレーション。 - **評価**: 全実行トレースを Spanner に保存し、LLM-as-a-Judge が自動アクションを Golden Data の人間応答と比較。 - **設計原則**: 推論(本エージェント)とアクチュエーション([[Actus]])を分離し、安全制御をモデルの進化から独立に保つ。 ## 横断比較 - [[Stratus]](学術)が障害の検知/診断/緩和の専門エージェントを状態機械で編成するのに対し、AI Operator は推論とアクチュエーションを別エージェント([[Actus]])に分離する点で「安全境界の置き方」が産業実装らしい。いずれもマルチエージェントでインシデント対応を自律化する系統。 ## 関連 - ソース: [[@2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]] - 概念: [[SRE AI Autonomy Levels]] / [[agentic SRE]] / [[Transactional No-Regression]] - エンティティ: [[Google]] / [[Actus]] / [[Stratus]] - 関連 MOC: [[LLM4SRE - MOC]] ## 出典 - [[@2026__GoogleSRE__AI in SRE - Engineering the Future of Reliable Operations]](L3: Autonomous Mitigation)