> [!abstract] 概要
> [[Mark Burgess (SRE)|Mark Burgess]](CFEngine 創始者)による SRE Book の序文。[[Google]] がシステム管理を第一原理から問い直し、ソフトウェアエンジニアリングと自動化によって運用を工学的規律へ変革した経緯を俯瞰する。
## 書誌情報
- 書名: Site Reliability Engineering: How Google Runs Production Systems
- 編者: [[Betsy Beyer]], Chris Jones, Jennifer Petoff, [[Niall Murphy]]
- 出版: O'Reilly Media, 2016 年 4 月
- 序文著者: [[Mark Burgess (SRE)|Mark Burgess]]
## 要旨
Burgess は、[[Google]] が従来のシステム管理の慣行を第一原理から再考したことを強調する。従来の運用は手動的・反復的な作業の積み重ねであったが、Google は SRE(Site Reliability Engineering)という職種を創設し、ソフトウェアと自動化によって運用そのものをエンジニアリングの規律へ転換した。
核心的な洞察は次の 3 点である。
1. **推論の文書化の永続的価値**: 「実装は一時的だが、文書化された推論は無価値にならない(Implementations are ephemeral, but the documented reasoning is priceless)」。特定のシステムやツールは世代交代するが、なぜそう設計したかの推論は次世代の設計判断に活きる。
2. **ビジネスプロセスとしてのスケーリング**: インフラのスケーリングは機械を増やすことではなく、ビジネスプロセスをスケールさせることである。人手に比例して運用が増える従来モデルは限界がある。
3. **運用のエンジニアリング化**: 反復作業([[トイル]])をソフトウェアで置き換えることで、運用チームの規模をサービスの規模から切り離す。
## 位置づけ
本序文は SRE の思想的基盤を外部の著名実務家の視点から紹介する役割を担う。Burgess の CFEngine は構成管理自動化の先駆であり、その立場から Google の SRE アプローチを「原理からの再構築」として評価している点に意義がある。