# インシデント考古学 ## 定義 インシデント考古学(Incident Archaeology)は、過去のインシデント記録(ポストモーテム・チケット・タイムライン・メタデータ)を**アーティファクト**として扱い、考古学的な発掘・分析を行う実践手法である。[[Clint Byrum]]([[Spotify]])が 2023 年に提唱した。単一インシデントを深掘りするのでなく、**多数のインシデントを広く横断する**(「深さでなく広さ」)ことで、個別のポストモーテムでは見えないパターンや仮説を発見する。 主眼は修復でも再発防止でもなく**学習**にある。次の 8 ステップで実施する:(1) アーティファクトを見つける、(2) 時間的コミットを決める、(3) 仮説を立てる、(4) タイムボックスに収まる方法論を設計する、(5) データサイエンティストと協働する、(6) アーティファクトをリスト化して各自分析する、(7) データを分析する、(8) まとめて学んで共有する(Source: [[@2023__SREcon23Americas__Incident Archeology - Finding Value in the Paperwork and Narratives of the past]] p.21)。 ## 横断的知見 - **インシデント記録の「見かけ上の価値」と「考古学的価値」は別物**: ポストモーテムは本来「学習」のために書かれるが、実際には「コミュニケーション・説明責任・調整」という即時目的のために使われ、学習は「運が良ければ」付いてくるものとして扱われる([[@2023__SREcon23Americas__Incident Archeology - Finding Value in the Paperwork and Narratives of the past]] p.7)。インシデント考古学はこの学習不足を、事後的な横断分析で補う試みである。 - **小サンプルサイズが統計的相関を困難にする**: Byrum は相関分析が「非常に問題が多い」と述べ、サンプルサイズが小さく母集団が不明なためまともな p 値を得にくく、「センサスに近い」アプローチになると指摘する([[@2023__SREcon23Americas__Incident Archeology - Finding Value in the Paperwork and Narratives of the past]] p.23)。これはポストモーテムデータを定量分析に使う際の根本的な制約であり、仮説駆動の定性分析(ルーブリックによる評価)を組み合わせることが現実的である。 - **探していなかった知見が最も価値高い**: Spotify での実践では、設定した仮説(夜間インシデントの MTTR が高いか等)よりも、副産物として得られた知見(起動・終了時刻の 75% がデフォルト放置、業務時間中に 80% 宣言、変更起因は 30% のみ)の方が組織に大きなインパクトをもたらした([[@2023__SREcon23Americas__Incident Archeology - Finding Value in the Paperwork and Narratives of the past]] p.24)。 ## 未解決の問い - インシデント考古学の結果(仮説・発見・共有)が実際の信頼性改善につながったかを定量的に評価する手法は何か。[[ポストモーテム]] のアクションアイテム完了率問題と同様、「学んだ」が「改善した」に変換されるメカニズムが不明確。 - S4A(Spotify 固有の重篤度分類)の定義が不明。他組織のデータと比較するためには重篤度の共通定義が必要。 - ポストモーテム完了率 62%(2021 年 Spotify)は業界全体と比べて高いか低いか。比較対象となる業界横断データは存在するか。 - タイムボックス(考古学の時間制約)はどう設定すべきか。Byrum は「アーティファクトごとの最大分析時間を決める」と述べるが、具体的な目安は示されていない。 - データサイエンティストとの協働をスケールさせるにはどうすればよいか。Byrum が p.16 で示した「データサイエンスが入ったら問題が発覚した」経験は、統計的厳密性の確保が非自明であることを示す。 ## 関連 - [[ポストモーテム]] — インシデント考古学の主要アーティファクト。完了率・学習深度の問題がインシデント考古学の動機となる - [[インシデント管理]] — 考古学が対象とするデータの生成元プロセス - [[変更起因インシデント]] — Spotify データで 30% と測定された変化起因の割合は他ソースと比較可能 - [[インシデント重大度評価]] — ポストモーテム完了率が重大度・生産性影響度と相関するという観察 - [[structures/SRE - MOC]] — 関連 MOC への一方向参照 ## 出典 - [[@2023__SREcon23Americas__Incident Archeology - Finding Value in the Paperwork and Narratives of the past]] — 本概念の唯一の一次ソース(2026-06-28 時点)