# The Math behind the Incident Aftermath: A Practical Guide to Measuring Incident Impacts Navigation: [[index]] | [[インシデント影響測定]] | [[PayPal]] ## 概要 PayPal の Ashish Patel と Sriram Srinivasan が SREcon22 APAC(2022-12-07、シドニー)で発表したスライド。インシデント後の「影響はどれくらいだったか」という問いに対し、直感や経験則ではなく統計的手法で答えるための実務フレームワークを提示する。中心概念は FCI(Failed Customer Interactions、失敗した顧客とのやり取り数)で、正常時のベースライン予測値と実測値の乖離から顧客影響を定量化し、可用性(Availability)指標に変換する。ツールのアーキテクチャ、計算式、実データ例、セグメンテーション、他事業部への展開、開発上の課題までを一貫して扱う。 ## 主要メッセージ - インシデントの重大度判断は従来、担当者の主観や「なんとなく大きかった」という経験則に依存しがちである。これを補正するのが本ツールの目的(p.4-5)。 - FCI は「本来あったはずの成功件数」からの欠損分と、明示的にエラーを受けた顧客数を合算した指標で、インシデントの顧客影響を単一の数字に集約する(p.17-20)。 - 時系列予測モデル(6週間トリム平均等)でベースラインを推定し、実測トラフィックとの差分を自動計算する(p.9-12)。 - ツールはアラート発報からモデル計算・投稿までを自動化し、インシデント対応者が手動で影響を見積もる負担を減らす(p.6-8, p.30)。 - セグメンテーション機能により、国・製品・ビジネス指標・マーチャント・ユニーク顧客ごとの影響内訳を可視化できる(p.27)。 - 課題として、ユーザー入力への依存度の高さ、テスト・モデリングの難しさ、自動サジェスト機能構築の困難、分単位集計による近似誤差を挙げている(p.31)。 ## 視覚的に重要な図表 **p.5 インシデントライフサイクルと影響測定の位置づけ** ![[_attachments/srecon22apac-patel-incident-impact/page-005.png]] 検知→対応→復旧という通常のインシデントライフサイクルに対し、「影響測定」がポストモーテム・振り返りの入力として独立したステップであることを示す図。 **p.12 ツールアーキテクチャ** ![[_attachments/srecon22apac-patel-incident-impact/page-012.png]] アラート発報・手動トリガーからモデル計算・セグメンテーション・投稿までのパイプライン構成図。 **p.17 FCI 計算式** ![[_attachments/srecon22apac-patel-incident-impact/page-017.png]] FCI(Failed Customer Interactions)の算出式と、Baseline・Actual・Missed CI の関係を示す図解。 **p.26 可用性測定の実例** ![[_attachments/srecon22apac-patel-incident-impact/page-026.png]] Baseline 99.9990%、実測 Availability 99.6171%、FCI 33,322 件、Missed CI 0 件という実データに基づくサンプルチャート。 **p.27 セグメンテーション(国別内訳)** ![[_attachments/srecon22apac-patel-incident-impact/page-027.png]] Country / Products / Business Metrics / Merchants / Unique Customers の5軸セグメンテーションと、国別影響内訳(UK 352件30%、Germany 313件27%、France 143件12%、Italy 82件7% など上位国)を示す円グラフと表。 ## 概念・実体への接続 - [[インシデント影響測定]] — 本発表の中心概念(FCI・Availability 算出手法)を定義する concept ページとして新設。 - [[Ashish Patel]] — 発表者。PayPal Site Reliability Platform Engineering チームのソフトウェアエンジニア。 - [[Sriram Srinivasan]] — 発表者。PayPal の Technical Architect、SRE 領域で20年の経験。 - [[PayPal]] — 発表元組織。決済プラットフォーム。Xoom・Braintree といった傘下事業部への展開も p.28 で言及。 - [[インシデント重大度評価]] — 本発表の FCI/Availability は定量的な顧客影響指標であり、Google のフラグベーススコアリングとは異なるアプローチとして対比できる。 - [[ビジネスモニタリング]] — 顧客影響をビジネス指標として捉える点で関連。 ## 限界・不確実点 - 本発表の動画(Presentation Video)は USENIX 会員ログインが必要で取得できなかった。口頭説明・質疑応答の内容は本ページに含まれない。 - p.27 の国別セグメンテーション表は画像内で上位4か国(UK・Germany・France・Italy)のみ明瞭に判読でき、それ以降の行が存在するかは画像からは確認できない。 - p.9-11 のベースライン計算過程で使われる統計手法の詳細(トリム平均の具体的パラメータ等)はスライド上の簡略表記のみで、数式の全パラメータは判読できない。