# Chapter 1 How SRE Relates to DevOps
> [!abstract] 概要
> [[Niall Murphy]]、[[Liz Fong-Jones]]、[[Betsy Beyer]] らによる第 1 章。標語「class SRE implements interface DevOps」により、[[SRE]] を [[DevOps]] の哲学を具体的な職能・実践・信念として実装するものと位置づける。両者は、サイロ解体、小さく頻繁な変更、測定、ブレームレスな振り返り、同一ツール利用で重なる。一方で SRE は、[[サービスレベル目標]]・[[エラーバジェット]]・[[トイル]] 50% 上限など、サービス運用に対するより意見の強い実装を提供する。
## 書誌情報
- 書名: The Site Reliability Workbook
- 章: Chapter 1 — How SRE Relates to DevOps
- 著者: [[Niall Murphy]], [[Liz Fong-Jones]], [[Betsy Beyer]], [[Todd Underwood]], [[Laura Nolan]], [[Dave Rensin]]
- 出版: O'Reilly Media / Google, 2018 年
- URL: https://sre.google/workbook/how-sre-relates/
## 主要主張
- DevOps は、IT 開発・運用・ネットワーク・セキュリティのサイロを壊すための、文化・自動化・リーン・測定・共有(CALMS)に基づく緩やかな原則群である。
- SRE は、[[Ben Treynor Sloss]] が [[Google]] で作った職能・実践・信念の集合であり、DevOps の哲学をより具体的な運用実装へ落とし込む。
- SRE の基本原則は、運用をソフトウェア問題として扱うこと、100% 可用性を目標にせず SLO で管理すること、トイルを最小化すること、同じサービスを扱うチームは同じツールを使うことにある。
- DevOps と SRE は、変更は小さく継続的であるべき、測定が会話の土台になる、ブレームレスなポストモーテムが必要、全体の速度改善が目的、という点で一致する。
- 差分として、DevOps はより広い文化・哲学であり、SRE はより狭いサービス指向の責務と、SLO・エラーバジェットなどの意見を持つ。
- 導入には、数値目標を狭く評価して Goodhart 的なゲーム化を招くこと、インシデント責任を他部門へ押し付けること、SRE を名前だけ導入することを避ける必要がある。
## 既存 SRE Book との関係
本章は [[@2016__OReilly__SRE Book - Foreword]] の「class SRE implements DevOps」を、Workbook 側で章全体の論点として展開する。[[SRE Book]] が原則を提示したのに対し、本章はそれを DevOps の CALMS、組織インセンティブ、共有所有モデルと照合し、導入条件を明文化する。
## 抽出した概念候補
- SRE と DevOps の関係
- CALMS
- 共有所有モデル
- 同一ツール原則
- トイル 50% 上限
- SLO に基づく運用意思決定
- ブレームレスポストモーテム
- Goodhart の法則と運用インセンティブ
- rename-and-shame
## 抽出した実体候補
- [[Niall Murphy]]
- [[Liz Fong-Jones]]
- [[Betsy Beyer]]
- [[Todd Underwood]]
- [[Laura Nolan]]
- [[Dave Rensin]]
- [[Ben Treynor Sloss]]
- [[Andrew Clay Shafer]]
- [[John Willis]]
- [[Damon Edwards]]
- [[Jez Humble]]
- [[Google]]
- [[DevOps]]
- [[SRE Workbook]]
## 統合メモ
- [[SRE]] の横断的知見「SRE と DevOps は補完関係」に、本章を主要根拠として追加できる。
- 新規 concept [[DevOps]] または [[SREとDevOps]] を作る価値がある。既存 wiki に DevOps 専用ページがなければ、本章が初期定義に向く。
- [[サービスレベル目標]] には「SLO 違反はチームをブレームレスに再検討へ戻す」という文化的含意を追記できる。
- [[トイル]] には 50% 上限を「上限」ではなく「エンジニアリング時間を保証する仕組み」として追加できる。
- [[ソフトウェア変更管理]] には、小さく頻繁な変更・自動テスト・ロールバックの DevOps/SRE 共通原則として接続できる。
## 出典
- https://sre.google/workbook/how-sre-relates/