[[Site Reliability Engineering - Google]] #### 1. Inroduction > 願望は戦略にあらず。 ― SREの格言 #### 5. トイルの撲滅 > 通常運用中のシステムに人手が必要なら、それはバグだ。 > 通常の定義は、システムの成長と共に変化する。 ― Carla Geisser、Google SRE #### 7. Google における自動化の進化 暗黒芸術を除けば、そこにあるのは自動化と機械化だけだ。 ― Federico García Lorca(1898–1936)、スペイン人詩人、劇作家 #### 9. 単純さ > そうして費用をいくらつぎ込んでも、信頼性だけは手に入らない。 > 信頼性は、極限まで単純さを追求することでしか手に入らないのだ。 ― [[C.A.R. Hoare]]、チューリング賞記念講演にて #### 10章 時系列データからの実践的なアラート > クエリは流れ、ページャーは沈黙を守らんことを。 ― SREに伝わる祈りの言葉 #### 12章 効果的なトラブルシューティング > 注意しなければならないのは、システムがどのように動作するはずなのかを理解しただけでは、 エキスパートたりえないということだ。システムがなぜうまく動作しないのかを調査することこそが、エキスパートへの道なのだ。 ― Brian Redman > 物事がうまくいく場合というものは、物事がおかしくなる場合の中の特殊な例に過ぎない。 ― John Allspaw #### 15章 ポストモーテムの文化: 失敗からの学び > 失敗のコストは教育である ― Devin Carraway #### 17章 信頼性のためのテスト まだ動かしたことがないのであれば、それは動かないものとみなすべきだ。 ― よみ人しらず #### 22章 カスケード障害への対応 > 最初に成功しなかったら、指数的にバックオフすることだ。 ― Dan Sandler、Google > ソフトウェアエンジニア なぜ人々は少しのジッターを加えることをいつも忘れてしまうのか? ― Ade Oshineye、Google デベロッパーアドボケート --- [[📘Site Reliability Workbook]] #### 7. 単純さ > うまく動作する複雑なシステムはいずれも、うまく動作するシンプルなシステムから進化し たものなのである。 ――Gallの法則(http://bit.ly/2syRTi5)