# 小さくはじめるSLI/SLO ~育てながら組織に定着させる実践知~ Navigation: [[@2026__Road to SRE NEXT 2026 神戸__小さくはじめるSLI-SLO 育てながら組織に定着させる実践知]] | [[サービスレベル目標]] | [[エラーバジェット]] | [[SLI-SLO段階的導入]] ## 概要 [[Narimichi Takamura]]([[Topotal]] CEO / SRE)が Road to SRE NEXT 2026 @神戸(2026-06-15)で発表した 48 スライドの講演。SLI/SLO を組織に定着させる際の 3 つの難点(定義・運用・定着)を整理し、SRE 導入の 4 ステップを援用した「小さくはじめる戦略」と、定義・運用・定着それぞれを 5 段階成熟度モデルで育てるプラクティスを体系化する。対象は「SLI/SLO 導入に悩んでいる人」「導入したが活用できていない人」「組織に広げたい人」。 ## 主要メッセージ - **3 つの難点の構造**: 定義の難しさ(CUJ〜SLO までの合意形成・追加計装に時間がかかる)、運用の難しさ(メンテ除外・新機能考慮・見直しが行われない)、定着の難しさ(SRE チームしか興味がない・SLI/SLO 会議が気まずい)。結果として「理想を追い求め膨大な時間をかけて導入したが、価値が認められずに形骸化する」ケースが頻発する(p.17)。 - **SRE 4 ステップを SLI/SLO に流用する**: Google の「Four steps to jumpstarting your SRE practice」を SLI/SLO 導入に転用。①小さく始めて繰り返す、②チームを支援する、③学んだことをスケールする、④データドリブン型マインドセットを具体化する(p.21-23)。 - **段階的な SLI/SLO 導入(改)**: 前半ステップを細分化し改善ループを素早く回す。(1)特定チーム内で価値検証、(2)SLO 違反時の小さなアクションを定める、(3)ユーザー満足度に関わる指標の一部を SLI/SLO に反映・運用、(4)すべての指標を特定して SLI/SLO に反映・運用(p.25)。 - **SLO 違反ポリシーの 5 段階拡大**: Level1 なにもしない → Level2 SRE チームが原因特定と対策 → Level3 SRE が原因特定し開発チームが対策 → Level4 各チームに SLO 正常化責任を移譲 → Level5 開発スケジュールやリリースタイミングの意思決定に SLO を組み込む(p.36)。 - **定義・運用・定着の成熟度モデル**: 3 軸それぞれに Lv1〜Lv5 を定義。Lv5 の「定着」は「信頼性が組織の共通言語となり、事業・開発・運用の意思決定に組み込まれている」状態(p.44-46)。 ## 視覚的に重要な図表 **p.13 プロダクトフェーズによる信頼性の違い(S カーブグラフ)** ![[_attachments/road-to-sre-next-kobe/page-013.png]] INTRODUCTION・GROWTH・MATURITY・DECLINE の各フェーズで推奨 SLO 方針が異なる。INTRODUCTION では「Focus on Development」、MATURITY では「Balancing Reliability and Development」。SLI が定まった後も、フェーズによって SLO は変わり続けることを可視化している。 **p.16 SRE Concept Pyramid(Error Budget による意思決定までの壁の高さ)** ![[_attachments/road-to-sre-next-kobe/page-016.png]] ピラミッド底辺の「SLI(Manual Selection)」から頂点の「Error Budget-Based Decision Making(Manual Decision-Making Policies)」まで 5 段。Basic SRE Foundations(SLI〜SLO)と Advanced SRE Foundations(Error Budget Policy〜Error Budget-Based Decision Making)を対比している。Error Budget ポリシーによる意思決定は最上位の Advanced SRE Foundation であり、最初から目指すには壁が高いことを視覚化している。 **p.17 SLI/SLO 理想と現実の比較表** ![[_attachments/road-to-sre-next-kobe/page-017.png]] 定義・運用・定着それぞれで理想と現実を対比。定義:最適な SLI/SLO がサクッと決まる ↔ CUJ〜SLO までの合意形成・追加計装に時間がかかりすぎる。運用:健全な SLI/SLO が維持される ↔ メンテ時間の除外されない・新機能が考慮されない・見直しが行われない。定着:SLI/SLO をもとに意思決定が行われる ↔ SRE チームしか興味がない・SLI/SLO 会議がやや気まずい。 **p.25 段階的な SLI/SLO 導入(改)** ![[_attachments/road-to-sre-next-kobe/page-025.png]] 前半パートのステップを細かく分解し、改善のループを素早く回す方針。4 ステップそれぞれに難易度と対応範囲を整理している。Topotal ロゴ入りのオリジナルフレームワーク。 **p.36 SLO 違反に関する段階的なポリシーの改善例** ![[_attachments/road-to-sre-next-kobe/page-036.png]] Level1〜Level5 のアクション一覧。「開発を止める」ような極端なアクションを最初からトリガーする必要はなく、SLO の認知と価値が伝わるにつれてアクションする範囲を徐々に広げる。 ## 概念・実体への接続 - [[SLI-SLO段階的導入]] — 本スライドが提示する段階的導入フレームワーク全体 - [[サービスレベル目標]] — SLI/SLO/SLA の基礎概念 - [[エラーバジェット]] — Error Budget Policy の段階的改善(p.36 のポリシーレベルに対応) - [[Narimichi Takamura]] — 登壇者 - [[Topotal]] — 所属組織(「段階的な SLI/SLO 導入(改)」は Topotal の実践知) ## 限界・不確実点 - transcript なし(音源・動画は未取得)。口頭での補足説明・Q&A は不明。 - SRE Concept Pyramid の出典として "Establishing SRE Foundations: SRE Concept Pyramid" が引用されているが(p.16、p.30)、元資料の著者・URL は本スライドから確認できない。 - "Four steps to jumpstarting your SRE practice" の出典も脚注 1 として引用されているが(p.21)、URL 等は確認できない。 - p.29 の "it's a marathon, not a sprint" は上記 "Four steps to jumpstarting your SRE practice" の引用としてのみ示されており、具体的な引用箇所は不明。