[Automated Incident Management Through Slack | by Vlad Vassiliouk | The Airbnb Tech Blog | Jul, 2022 | Medium](https://medium.com/airbnb-engineering/incident-management-ae863dc5d47f)
- Requirements
- Slackで一元化
- 単一のファネル
- 会議の設定やチャンネルのアーカイブの自動化
- Slack bot
- [slack package - github.com/slack-go/slack - Go Packages](https://pkg.go.dev/github.com/slack-go/slack)
- ボットに送信されるすべてのコマンドがSlackチャンネルのメンバーから見えるように、スラッシュコマンドの代わりにチャットコマンドを使用
- 4つの主要コマンド
- `new incident <summary>`: Jira チケットとインシデントマネージャを作成。
- `new channel <ticket>`: Slackのインシデントチャンネルを作成。
- `page <service|user>`: PagerDutyかまたは直接オンコールにページ。
- `get timeline`: インシデント後の分析用に、重要なチャットイベントを簡潔なタイムラインにまとめる。
- 特定のemojiリアクション付きのメッセージを検索
- インシデントサイクル ![[Pasted image 20220810084618.png]]
- 4つの主要コマンドとそれぞれ対応
- インシデントレビュー
- 毎週 after action review meetings (AAR) を開催
- 最近の重大性の高いインシデント、インシデント後のレポートを確認し、是正措置が呼び出され割り当てられることを確認
- botが是正措置の締め切りの数日前にSlack上で警告メッセージを送信し、締め切りを過ぎると、チケットに割り当てられたユーザーに別のメッセージを送信
- チャンネルアーカイブ
- botはインシデントのJiraチケットがクローズされてから10日後にインシデントチャンネルを自動的にアーカイブ
- 評価
- 各タスクを手動で完了するのにかかる平均時間をボットの自動化と比較して測定することで、2022年現在、推定44時間の時間を節約