# SRE Workbook ## 概要 "The Site Reliability Workbook"(O'Reilly, 2018)は、[[SRE Book]] の原則を実際の組織・サービスへ導入するための実践編である。[[Google]] SRE の経験だけでなく、[[Evernote]]、[[The Home Depot]]、[[PagerDuty]] など外部組織の事例も含み、SLO 導入、SLO ベースアラート、トイル削減、オンコール、インシデント対応、ポストモーテム文化を実装手順として説明する。 ## 位置づけ SRE Book が SRE の原則と語彙を定義した文献であるのに対し、SRE Workbook はそれを「どう始めるか」「どう測るか」「どうチームの行動へ接続するか」へ展開する。特に [[サービスレベル目標]] は、定義から文書化・ステークホルダー合意・エラーバジェット方針・アラートルールへ拡張される。 ## 取り込み済み章 - [[@2018__Google SRE Workbook__Foreword I]] - [[@2018__Google SRE Workbook__Foreword II]] - [[@2018__Google SRE Workbook__Chapter 1 How SRE Relates to DevOps]] - [[@2018__Google SRE Workbook__Chapter 2 Implementing SLOs]] - [[@2018__Google SRE Workbook__SLO Engineering Case Studies]] - [[@2018__Google SRE Workbook__Monitoring]] - [[@2018__Google SRE Workbook__Alerting on SLOs]] - [[@2018__Google SRE Workbook__Eliminating Toil]] - [[@2018__Google SRE Workbook__Simplicity]] - [[@2018__Google SRE Workbook__Part II Practices]] - [[@2018__Google SRE Workbook__On-Call]] - [[@2018__Google SRE Workbook__Incident Response]] - [[@2018__Google SRE Workbook__Chapter 10 Postmortem Culture - Learning from Failure]] - [[@2018__Google SRE Workbook__Conclusion]] - [[@2018__Google SRE Workbook__Appendix A Example SLO Document]] - [[@2018__Google SRE Workbook__Appendix B Example Error Budget Policy]] - [[@2018__Google SRE Workbook__Appendix C Results of Postmortem Analysis]] ## 関連 - [[SRE Book]]: 原則編・定義書 - [[SRE]]: ディシプリン全体 - [[サービスレベル目標]] / [[エラーバジェット]] / [[トイル]] / [[インシデント管理]]: Workbook が実装手順を補強する主要概念 ## 出典 - The Site Reliability Workbook, Google / O'Reilly Media, 2018, https://sre.google/workbook/table-of-contents/