[Cybozu における次世代障害対応研修の計画と実践 - Cybozu Inside Out | サイボウズエンジニアのブログ](https://blog.cybozu.io/entry/2021/10/12/170000)
- ボードゲーム風の障害対応ロールプレイ
- ゲーム内容:新卒社員にSREの役割をになってもらい、持ち時間60分で障害対応を行う
- あらゆるアクション(調査・操作コマンド)を擬似的に行い、障害対応を進める
- ゲームマスター役の SRE が事前に障害の概要、各種コマンドの結果やメトリックスのグラフを表として用意し、それらを元に障害のシチュエーションや疑似障害対応を進行する
- 数人のチームで会話しながら障害の原因となるものを探して解決策まで提示して貰うというゲーム
- 環境を操作するアクションにはそれぞれのアクションごとに時間が消費される
- 例:「特定のプログラムの再起動:-1分」「お客様に行動を依頼する:-25分」
- ボードゲームの課題
- ゲームマスターという役割を持った人間による進行が必要であること
- 正解を知る人がいない状況でのロールプレイをしたい。
- 課題の解決
1. 実際に障害対応を行うチーム単位での研修参加
2. 全員がリモート状態で参加可能
3. 実際に動く環境でのロールプレイ
- 環境さえあれば、ゲームマスターが居なくても各自で練習する事も可能