# Postmortem as a textbook Navigation: [[ポストモーテム]] | [[KATO Toshiya]] | [[LINE株式会社]] ## 概要 [[LINE株式会社]]の[[KATO Toshiya]](Embedded SRE)が「インシデントにどう対応してきたか?みんなで学ぶポストモーテム Lunch LT」(Findy主催、2023-02-09)で発表。ポストモーテムを「当事者と参加者だけでなく、未来の誰かが学べる教材」へと昇格させるためのプロセス改善を報告する。問題の根本を「当事者が書くため非専門家が理解できる情報が省略される」という構造に求め、SREが全体共有前に主導する30分の執筆専用会議を解法として提示する。 ## 主要メッセージ **ポストモーテムのステップアップ(p.3)** ![[_attachments/Postmortem_as_a_textbook/page-003.png]] 3段階の品質階段: (1)「不足のない事実(批判をしない)」→(2)「現実的な対応策(十分な検討時間とレビュー)」→(3)「他チームが学べる(十分な執筆時間とレビュー、資料からシステムの概要もすべて読み取れる)」。この発表は第3段階への到達を目標とする。 **学びの影響範囲(p.4)** ![[_attachments/Postmortem_as_a_textbook/page-004.png]] 学びの受け手を2層で定義する。従来の対象「障害が発生したチーム and ポストモーテム会議に参加した人」に加え、「ポストモーテム会議不参加の人 and 未来の誰か」を明示的な受け手として設定する。この定義拡張がポストモーテム品質の要求水準を引き上げる。 **他チームが学びやすいポストモーテムの要件(p.5)** - 読むだけでシステムの概要が理解できる: 何のためのシステムか、どんな設計か、どんなミドルウェアを使っているか - 問題と対応策の間に飛躍がない: 対応策に至る制約を可能な限り明確化する **なぜ省略が発生するのか——5つの構造的問題(p.9〜14)** 当事者がポストモーテムを執筆・共有する既存プロセスの構造が省略を生む: 1. 参加者にドメインエキスパートしかいない 2. 議論に割り込んで前提事項を質問しにくい 3. 当事者の目的が「共有と対応策の合意を取ること」(再発防止優先) 4. ポストモーテムの書き方自体への指摘をしにくい 5. 質問しても口頭で補足されて終わり(Q.「なんでこうなってるんですか?」 A.「XXXという制約があるからです」) **SRE主導の執筆会議——問題→解決の1対1マッピング(p.16)** ![[_attachments/Postmortem_as_a_textbook/page-016.png]] 5つの問題に対応する解決策: | 問題 | 解決策 | |------|--------| | 1. ドメインエキスパートしかいない | SREが担当する他チームを呼ぶ | | 2. 議論に割り込んで質問しにくい | 質問フェーズを最初に設ける | | 3. 当事者の目的が対応策の合意 | ポストモーテムを教材にしたいSREが主導 | | 4. 書き方への指摘をしにくい | 提案フェーズを設ける | | 5. 質問しても口頭補足で終わり | 会議後に質問と回答を元に編集するフェーズ | 会議30分の流れ: 1. 15分黙読し、質問と提案をコメント 2. SREが質問をピックアップし、執筆者に回答してもらう(SREが回答をポストモーテムにメモ) 3. 全質問終了後、提案を確認(例: シーケンス図追加 / 追加対策案) 4. 会議の最後にKudo wallを作成(この障害で素敵だった人を称える) 5. 会議終了後、当事者がコメントをベースに編集 さらなる副次効果: SREは会議後アンケートでファシリテートへのフィードバックを得られる。慣れると参加者が会議前に読んでコメントを残すようになる。 **まとめ(p.26)** ![[_attachments/Postmortem_as_a_textbook/page-026.png]] 従来フロー(当事者→少ない受け手への共有)から、SRE主導フロー(当事者+SREによる執筆会議→多くのチームへの共有)への転換。「ポストモーテム共有会議の前にSRE主導の執筆会議を挟むことで、品質も向上し、共有会議の時短にもなった」。 ## 概念・実体への接続 - [[ポストモーテム]] — ブレームレス文化・横展開学習・ファシリテーション手法の集積 - [[KATO Toshiya]] — 登壇者 - [[LINE株式会社]] — 発表組織(Embedded SRE体制) ## 限界・不確実点 - transcript なし(動画・音源未取得)。口頭での補足説明・質疑応答の内容は不明。 - 会議の効果(品質向上・共有会議の時短)は定量値の記載なし。Kudo wallの効果も評価データ不明。 - 発表はLunch LT形式のため短編。詳細な実装・失敗事例・スケールへの課題は不明。