> [!abstract] > SRE Book の Part III は、SRE の実践体系をサービス信頼性ヒエラルキー(Service Reliability Hierarchy)として構造化する。マズローの欲求段階説に倣い、モニタリングを土台とした 7 層モデルで、各プラクティスの依存関係と優先順位を明示する。 ## 書誌情報 - タイトル: Part III: Practices(序論) - 編者: [[Betsy Beyer]]、Chris Jones、Jennifer Petoff、[[Niall Murphy]] - 書籍: [[SRE Book]](Site Reliability Engineering: How Google Runs Production Systems, O'Reilly, 2016) - URL: https://sre.google/sre-book/part-III-practices/ ## サービス信頼性ヒエラルキー マズローの欲求段階説と同様に、下位層が満たされて初めて上位層のプラクティスが有効に機能する。最も基礎的な層から順に以下のとおりである。 ### 第 1 層: モニタリング(Monitoring) すべての信頼性プラクティスの土台である。サービスの状態を計測・可視化できなければ、障害の検知も改善もできない。4 つのゴールデンシグナル(レイテンシ・トラフィック・エラー・サチュレーション)が基本指標となる。 → [[@2016__OReilly__SRE Book - Chapter 6 Monitoring Distributed Systems]] ### 第 2 層: インシデント対応(Incident Response) モニタリングが障害を検知した後の対応プロセスである。オンコール体制、エスカレーション手順、コミュニケーションプロトコルを整備する。 → [[インシデント管理]] ### 第 3 層: 根本原因分析(RCA / ポストモーテム) インシデント対応の後に行う振り返りである。ブレームレスポストモーテム(非難なき事後分析)を原則とし、再発防止策を導出する。個人の失敗ではなくシステムの弱点に焦点を当てる。 → [[根本原因分析]] ### 第 4 層: テスト(Testing) 障害の予防と早期発見のためのテスト体系である。単体テスト、統合テスト、本番環境でのカナリアデプロイ、障害注入テストなどを含む。 → [[障害注入]] ### 第 5 層: キャパシティプランニング(Capacity Planning) 需要予測に基づくリソースの事前確保と、有機的成長・非有機的成長(新機能ローンチなど)の双方への対応である。 ### 第 6 層: アーキテクチャ(Development) 信頼性を設計段階から組み込むアーキテクチャ設計である。冗長性、グレースフルデグラデーション、負荷分散などの設計判断を含む。 ### 第 7 層: プロダクトローンチ(Product) 新しいサービスやフィーチャのローンチに伴う信頼性レビューである。ローンチチェックリストとローンチレビュー委員会による品質ゲートを設ける。 ## ヒエラルキーの含意 - **下位層優先**: モニタリングなしにインシデント対応は機能しない。RCA なしにテスト戦略は改善しない。各層の充足度が上位層の有効性を決定する。 - **段階的改善**: すべてを一度に完璧にする必要はない。まずモニタリングを確立し、インシデント対応を整備し、段階的に上位層を充実させる。 - **組織成熟度の指標**: ヒエラルキーのどの層まで充実しているかが、SRE 組織の成熟度を示す。 ## 関連 - [[@2016__OReilly__SRE Book - Chapter 6 Monitoring Distributed Systems]]: 第 1 層の詳細 - [[@2016__OReilly__SRE Book - Chapter 5 Eliminating Toil]]: プラクティス全体を支えるトイル削減 - [[@2016__OReilly__SRE Book - Chapter 7 Automation at Google]]: 各層を横断する自動化 - [[@2007__LISA__On Designing and Deploying Internet-Scale Services]]: Hamilton のベストプラクティス体系との対比 ## 出典 - Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Murphy (eds.), "Part III: Practices," in *Site Reliability Engineering*, O'Reilly, 2016