[失敗して攻め続けるために - freeeのエンジニアが障害対応で実践していること - freee Developers Blog](https://developers.freee.co.jp/entry/anyone-who-has-never-made-a-mistake-has-never-tried-anything-new_)
1. インシデント検出時にSlackで対応することを宣言する
2. botによりGoogleFormへのリンクが生成される
3. フォームに必要事項を入力する
- インシデントの種類(サービス障害、セキュリティインシデント、オペレーションインシデント、紛失)
- 障害対応訓練かどうか
4. Google Docが作成される。DocのリンクとGoogle meetへのリンクが書かれたアラートがSlackに通知される。
一定以上の規模のインシデントの場合、ユーザーへのアナウンス(ステータスページ更新、SNSへの発信、カスタマサポートチームやセールスチームへの共有)
担当エンジニアが速やかにインシデントレスポンスできるようにするために、インシデントレスポンスの支援チームが次の仕事を行う。
- 他のチームに状況共有するために定期的に障害の状況を3行程度にまとめてアナウンスする
- 障害報に影響ユーザー数が書かれていないなど、記載漏れがある場合は障害発生チームに伝える
- 障害対応後に義務付けられている障害のふりかえりが実施されていない場合は障害発生チームにアナウンスする