ゲーム理論とSRE - yuuk1's Digital Garden

# ゲーム理論とSRE ## 定義ゲーム理論とは「自分の成果が他者の選択に依存する状況」を研究する学問であり、SRE に適用したとき、信頼性の問題が個人の意図や能力ではなく**システム全体の構造（均衡）**に由来することを明らかにする。[[Daria Barteneva]]（[[Microsoft Azure]]）が SREcon26 Americas（2026-03-26）で提唱したフレームワーク「Reliability Equilibrium」は、5 つのゲーム類型で SRE の社会技術的失敗パターンを体系化する。(Source: [[@2026__SREcon26Americas__Reliability Equilibrium - The Hidden Playbook behind SRE Influence]]) **核心命題**: SRE の障害の多くは技術的問題ではなく**調整（coordination）の失敗**であり、ゲームのルール（ペイオフ・情報・リスク帰属）を変えることで、より良い行動が合理的選択になる。「SRE work is mechanism design. Redesign the game, so better behavior becomes the rational choice.」 **ナッシュ均衡**とは、各プレイヤーが他者の戦略を所与として自分の最良手を選んでいる安定状態である。重要なのは、ナッシュ均衡は「良い」状態を意味せず、「安定」を意味するだけである点だ。デプロイ凍結のような劣った状態もナッシュ均衡に収束しうる。 ## 5 つの失敗パターンと SRE 適用 ### 囚人のジレンマ — インセンティブの歪み - **SRE の文脈**: デプロイ凍結。ロールバックが困難・テレメトリが弱い・変更後の責任追及が強い環境では「フリーズ」が全員の支配戦略になる。 - **根拠**: DORA（DevOps Research & Assessment）はエリートパフォーマーがデプロイ頻度（速度）と変更失敗率（安全性）を同時に改善することを示す。凍結は「safe but slow, local optimization」象限に留まる。 - **設計解**: (i) カナリアとプログレッシブデリバリーでシッピングコスト低減、(ii) エラーバジェットでポリシーが判断を置換、(iii) シュタッケルベルク先手——SRE が SLO とガードレールを先にコミットし、チームが安全出荷することが合理的応答になる。 - **ペイオフ比較**: Freeze/Freeze = Dev:2, SRE:4, Leadership:3 → Ship/Ship = Dev:5, SRE:4, Leadership:5（メカニズム設計後）。 ### Stag Hunt — 調整の失敗 - **SRE の文脈**: 信頼性への集合的投資（オンコール改善・プラットフォーム強化）。協調投資（Stag）vs 個人安全（Hare）の 2 均衡ゲーム。 - **構造**: Stag/Stag=(3,3)、Hare/Hare=(1,1)——両方が Nash 均衡。Hare 均衡は「安定だが凡庸」。 - **診断**: チームが Stag を避けるのは信頼性を求めていないからではなく、調整を信頼できないからだ。 - **設計解**: 信頼でなく設計で調整を担保する（SLO・共有インシデント定義など）。 ### ベイジアンゲーム — 不完全情報 - **SRE の文脈**: チームが他者のリスク状態・意図・計画を知らないまま意思決定する。 - **根本**: 「欠けているコンテキストの多くは隠されているのではなく、前提とされている」（John Allspaw）。 - **設計解**: 事前検死（pre-mortem）で隠れた知識を顕在化させる。不確実性でなく点推定ではなくリスク範囲を指標として公開する。 ### 公共財ゲーム — フリーライダー - **SRE の文脈**: オンコール改善・ドキュメント・ランブック・プラットフォーム強化・トイル削減。全員が恩恵を受けるがコストは個人持ち。 - **帰結**: 「信頼性がすべての人の仕事なら、それは誰のインセンティブでもない」。ポストモーテムも公共財——全員が学習から恩恵を受けるが、時間と脆弱性の開示というコストは個人が払う。 - **設計解**: SLI/SLO は公共財メカニズム——共有 SLO が信頼性を共有ペイオフに変換し、フリーライダーを不可視でなくする。 ### 進化的ゲーム — 文化的固着 - **SRE の文脈**: インシデント対処法 → 繰り返しの成功 → 標準慣行 → 自明の規範。「この段階でゲームは人間が行うのでなく、文化が行うようになる」。 - **回路遮断**: インシデント対応の繰り返しゲームで「英雄主義の報酬」という悪い均衡を解除するには、防止を報酬し、自動化をプロダクト作業として資金化し、オペレーション負荷を輪番制にする。 ## メカニズムデザインとしての SRE W. Edwards Deming の言葉「システムを伝えることで人に『もっと頑張れ』とは言わない」を引用し、3 つの設計軸を示す： 1. **ペイオフ変更** — 信頼性を合理的選択にする（近道のペイオフをなくす） 2. **情報変更** — システム状態を共有知識にする（チームが調整を信頼できる） 3. **リスク帰属変更** — 所有権と結果を対応させる（隠れたトイル・リスクを排除） ## シュタッケルベルクリーダーシップ SRE が先手プレイヤーとなってコミットし、他チームがベスト応答をする構造： - SLO・エラーバジェット・デプロイガードレール・リリースと変更の仕組み・オブザーバビリティのコミットメント・ポストインシデントの仕組み・キャパシティとリスクのガードレールを**先にコミット**する。 - 「権力（Power）≠ 権限（authority）、権力（Power）= コミットメント」。 ## 信頼性可視化の指標提案 - 重要ユーザージャーニー中 SLI を持つ割合 - エラーバジェット消費率と変動性（穏やか vs スパイク） - SLO 脅威の検知レイテンシ（time-to-signal） - インパクトを「乗り越えたインシデント数」でなく「排除したリスク」として表現 ## 横断的知見 - 本ソース単一のためまだ横断的比較は困難だが、ゲーム理論 SRE フレームワークは John Allspaw のレジリエンスエンジニアリング知見（情報共有の問題）・W. Edwards Deming のシステム思考・DORA の実証研究を接続する点で既存複数の潮流と整合する。 - DORA の実証（速度と安全性の同時改善）が囚人のジレンマ「フリーズが支配戦略になること」の反証として機能する構造は、実証研究とゲーム理論の橋渡しとして注目できる。 ## 未解決の問い - シュタッケルベルクリーダーシップは SRE チームが組織内で実際に先手を打てる前提を必要とするが、SRE が downstream にいる組織構造ではどう機能するか？ - 情報の非対称性の「解消」として pre-mortem や透明な信頼性指標が挙げられるが、公開することのリスク（責任追及・評判リスク）とのトレードオフはどう設計するか？ - 進化的ゲームとして固着した「英雄主義の文化」を変えるために、繰り返しゲームの記憶（ポストモーテムのアクション完了率・再発率）を明示的に追跡する組織での実例は？ - Shapley 値（スライド概要に言及あり）による貢献の公平な帰属については、スライド本文から詳細を確認できず未取得。transcript があれば補完できる。 ## 関連 - ソース: [[@2026__SREcon26Americas__Reliability Equilibrium - The Hidden Playbook behind SRE Influence]] - 登壇者: [[Daria Barteneva]] - 関連 wiki 概念: [[エラーバジェット]] / [[サービスレベル目標|SLO]] / [[ポストモーテム]] / [[DORA]] - 理論的参照元: [[囚人のジレンマ]] / [[公共財ゲーム]] / [[ナッシュ均衡]]（概念ページ未作成） - 関連 MOC: [[SRE - MOC]]（存在する場合） ## 出典 - [[@2026__SREcon26Americas__Reliability Equilibrium - The Hidden Playbook behind SRE Influence]]（Daria Barteneva, SREcon26 Americas, 2026-03-26） - Classic Game Theory (Rousseau; Nash), Economics of Information (Akerlof; Jensen & Meckling), Public Goods & Free-Rider Theory (Samuelson; Ostrom)——スライド p.59 脚注より