# How We Foster "Reliability" in Diversity Navigation: [[index]] | [[sources/_index]] [[Narimichi Takamura]]([[Topotal]] CEO / SRE)が SRE NEXT 2022(2022-05-14)で発表したスライド。多様な組織コンテキストの中で「適切な信頼性」を定義し、育てていくための取り組みを体系化した内容。 ## 概要 組織ごとに信頼性の定義は異なり、SRE を一様に実践するだけではうまくいかない。本発表は「なぜ適切な SRE 実践が難しいのか」「どう定義・育てるか」「環境変化にどう取り組むか」の3部構成で、SRE の組織変革を5つのステップと氷山モデルで整理し、Level 3(信念・価値観)へのアプローチとして MVV(Mission/Vision/Value)構築を提案する。 ## 主要メッセージ - **SRE の多様化は不可避**: プロダクトライフサイクル・システム特性・組織規模によって「適切な信頼性」は異なる。一様な SRE 実践では失敗する(p.11-13)。 - **SRE はマラソン**: 技術と人間(文化・プロセス)の課題が折り重なり、経営層を巻き込む組織変革を伴う。一朝一夕では成し得ない(p.14-15)。 - **5つのステップ**: ①実践に必要な情報を集める ②小さく始めて繰り返す ③チームを支援する ④学んだことをスケールする ⑤データドリブン型マインドセットを具体化する。いきなりプラクティス実践ではなく状況把握から始め、最終的に組織が自律的に SRE を実践できる状態を目指す(p.18)。 - **氷山モデルとの対応**: Level 1(製品・行動)・Level 2(ルール・ポリシー・プロセス)・Level 3(信念・価値観)の階層で整理すると、SLI/SLO の実践は Level 1/2 の取り組みだが、自律的 SRE には Level 3 の変化が必要(p.21-23)。 - **MVV が Level 3 へのアプローチ**: SRE の方向性・価値観を明確にするため、SREs の Mission/Vision/Value を策定する。会社の MVV と同心円状に整合させ、CTO・EM を巻き込んで作成する(p.24-28)。 - **組織コンテキストの3層モデル**: 企業活動を「企業方針(ミッション・ビジョン・経営戦略)」「サービス(内容・構造・課題)」「組織(構造・信頼性への意識)」に抽象化し、SRE に影響する変数を整理する(p.29-36)。 - **ダイナミックケイパビリティ**: 変化の激しい環境への耐性として Sensing(感知)・Seizing(捕捉)・Transforming(変容)の3能力を SRE の5ステップに紐付ける(p.44-46)。 - **多様性がアンチフラジャイルを生む**: 5ステップを繰り返すだけでは変革の幅に限界がある。組織・コミュニティの多様性が変化への耐性を強化する(p.49)。 ## 視覚的に重要な図表 **p.6 SRE コンテキスト循環フロー** ![[_attachments/sre-next-2022/page-006.png]] ①組織のコンテキストを読み取り → ②適切な SRE プラクティスを設計し → ③SREs が実装する、という循環を示す。 **p.12 プロダクトライフサイクルと信頼性の違い** ![[_attachments/sre-next-2022/page-012.png]] 横軸に時間(INTRODUCTION → GROWTH → MATURITY → DECLINE)、縦軸に売上。導入期は「Focus on Development」、成熟期は「Balancing Reliability and Development」とラベリングし、フェーズで求められる信頼性の重心が変わることを示す。 **p.21 組織の氷山モデル** ![[_attachments/sre-next-2022/page-021.png]] 行動原理の氷山メタファー: Level 1(製品・行動、水面上)/ Level 2(ルール・ポリシー・プロセス)/ Level 3(信念・価値観、最深部)。上層は変えやすく、下層は変えにくい。組織変革は上からも下からのアプローチも重要。 **p.22 SRE のプラクティスと氷山モデルの対応** ![[_attachments/sre-next-2022/page-022.png]] Level 1: Postmortem Template / Metrics / Logs / Meeting など。Level 2: SLI/SLO / Infrastructure as Code / Incident Workflow など。Level 3: Blameless / Data Driven / Replaced by Software など。 **p.28 会社と SREs の MVV を整合させる(同心円図)** ![[_attachments/sre-next-2022/page-028.png]] Company Mission, Vision(最外円)→ SRE Mission, Vision(中円)→ SRE Practices(最内円)の入れ子構造。SRE の MVV は会社 MVV の内側に収まるよう整合させる。 **p.32 企業活動の抽象化(3層ピラミッド)** ![[_attachments/sre-next-2022/page-032.png]] ピラミッドを「企業方針(上層)/ サービス(中層)/ 組織(底層)」に抽象化。SRE に影響する組織コンテキストを3つのレイヤーで整理する枠組み。 ## SLI/SLO・MVV の実践例(表、p.19・p.26) SLI/SLO への5ステップ適用例(p.19): | ステップ | 具体例 | |---|---| | 情報を集める | 信頼性課題を把握、事業責任者・エンジニアリングリーダーを特定 | | 小さく始める | 厳密な SLI/SLO を定義せず小さなサービス・チームで試行 | | チームを支援する | Embedded SRE を用いて各チームで SLI/SLO を実践 | | スケールする | 勉強会・SRE アンバサダー任命で適用範囲を拡大 | | データドリブン化 | SLI/SLO 改善を通して測定のカルチャーを醸成 | MVV 策定への5ステップ適用例(p.26): | ステップ | 具体例 | |---|---| | 情報を集める | 企業・組織のコンテキストを把握する | | 小さく始める | MVV を作成し SREs に絞って運用しながら改善を積み重ねる | | チームを支援する | Embedded SRE を用いて各チームで SRE の実践をする | | スケールする | MVV ベースの価値観共有・方向性すり合わせを行う | | データドリブン化 | SRE 実践に関する KPI を定め、測定のカルチャーを醸成する | ## 組織の信頼性マインドセット 5フェーズ(p.37) Google SREs の知見に基づく5分類(脚注4: "What's your org's reliability mindset? Insights from Google SREs"): | フェーズ | 説明 | |---|---| | Absent | 組織にとって信頼性は後回しになっている状態 | | Reactive | 直近の問題フォローはするが、システムへの長期的投資はほぼない | | Proactive | 定期的な組織プロセスで潜在的な信頼性リスクを特定・対処 | | Strategic | アーキテクチャ・プロダクト・プロセスを体系的に変更してリスクを管理 | | Visionary | 信頼性の最高位に到達し、ベストプラクティスを社内外で推進できる | → [[組織の信頼性マインドセット]] 参照。 ## 概念・実体への接続 - [[SRE組織変革]] — 5ステップ・氷山モデル・MVV の実践フレームワーク - [[ダイナミックケイパビリティ]] — 環境変化への耐性フレームワーク(Sensing/Seizing/Transforming) - [[組織の信頼性マインドセット]] — Absent → Visionary の5フェーズ - [[Narimichi Takamura]] — 登壇者 - [[Topotal]] — 所属組織(SRE as a Service 会社) ## 限界・不確実点 - transcript なし(音声・動画なし)。口頭での補足説明はカバーできない。 - p.40 の MVV 実例(Google Doc 画面)はテキストが小さく詳細値が一部読めない。Mission の "○○における SRE チーム" の ○○ は匿名化されていると判断した。 - p.47-48 の引用(SRE 本 18.3.5)は正確に書き写したが、書籍の版は特定できない。 ## 出典 - [[@2022__SRE NEXT__How We Foster Reliability in Diversity]](SRE NEXT 2022、2022-05-14) - 参考文献2(スライド内): The Professional Scrum Product Owner Book - 参考文献3(スライド内): Four steps to jumpstarting your SRE practice - 参考文献4(スライド内): What's your org's reliability mindset? Insights from Google SREs - 参考文献5(スライド内): 新時代の経営戦略「ダイナミック・ケイパビリティ」とは何か?