# PagerDuty Post-Mortem Process [[PagerDuty]] が公開するインシデント対応ガイドのポストモーテム章。実務で即使える手順とテンプレートを定義する。 ## ポストモーテムの責任と手順 インシデントコマンダー(IC)がポストモーテムオーナーを指名し、オーナーは以下を遂行する: - **会議スケジューリング**: SEV-1 は 3 暦日以内、SEV-2 は 5 営業日以内 - 徹底的な調査とチーム横断の調整 - 文書への知見の記載 - フォローアップ JIRA チケットの作成 - ポストモーテム会議の進行 ## タイムラインの位置づけ タイムラインがポストモーテム文書の**中核**。ステータスやインパクトの変化、対応者の主要行動を時系列で捕捉し、各エントリには [[Datadog]] グラフやログなどの支持メトリクスを付す。 ## 文書の構成要素 - 根本原因の特定(何が起きたか、なぜ起きたか) - 顧客影響メトリクス(イベント送信、処理遅延、通知配信) - データ収集に使ったコマンドとクエリ - 顧客向けの外部メッセージ(「outage」表現を避ける) ## ステータスワークフロー **Draft** → **In Review**(会議前) → **Reviewed**(会議承認済み) → **Closed**(全アクション JIRA で追跡中) ## 会議構成 出席者は IC・対応者・サービスオーナー・マネージャー。15–30 分の会議で、タイムライン振り返り・学びの共有・検知改善機会・顧客フィードバック・アクションアイテムを扱う。 ## 文化的側面 > 「well-designed, blameless postmortem allows teams to continuously learn」 非難なき文化が継続的学習を可能にするという原則を強調。 ## 既存 wiki との接続 - [[@2016__OReilly__SRE Book - Chapter 15 Postmortem Culture - Learning from Failure]] のブレームレスポストモーテム文化を、PagerDuty が具体的な手順書として実装した形 - [[ポストモーテム]] の実務プロセス面で、SEV 別のスケジュール規律とステータスワークフローは産業界の標準的な運用例 - [[@2018__Google SRE Workbook__Incident Response]] の IC 役割定義と整合する IC→ポストモーテムオーナーの責任移行