# The Un-Incident: Extracting Value from the Gray Area of Incident Response Navigation: [[index]] | [[log]] ## 概要 [[Andreas Deuschl]]([[Dynatrace]]、プロダクトリード Delivery / Reliability / Security)による USENIX SREcon25 EMEA(2025年10月8日、ダブリン)の 26 ページ発表。「インシデントとして宣言されなかった出来事」——すなわち [[アンインシデント]]——を、30〜60% の潜在インシデントが正式トラッキングを通過しないという実務観察から出発し、その類型化・検知・振り返り・プロダクト改善への接続までを体系化する。新しいメソドロジーではなく「曖昧さに焦点を当てる」実践的視点の転換として位置づけている(p.4)。 ## 主要メッセージ - **問いの再設定**: 「これはインシデントか」ではなく「ここから何を学べるか」を問え(p.14)。シェイクスピアのパロディ「インシデントであるかどうかではなく、それが問題ではない」(p.26)。 - **30〜60% の学習機会が失われている**: 正式宣言されないまま通過する潜在インシデントの実務推計(Source: Deuschl の自己経験, p.5)。根拠は "own experience" と明記——外部データとの照合は未検証。 - **Un-Incident の 4 類型** を定義し(p.6〜11)、各類型に対応した処方を提示する(p.13〜24)。 ## 視覚的に重要な図表 **p.5 30〜60% 数値と Un-Incident の 3 特性** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-005.png]] Un-Incidents は「宣言されない(Undeclared)」「見落とされる(Neglected)」「議論のまま終わる(Debated)」の 3 つの状態に分類されることを示し、30〜60% という推計値を強調する。Source は Deuschl 自身の経験と明記。 **p.13 Gray Zone Playbook** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-013.png]] 左列に 4 類型(No-CI / Near Miss / It's Not Our Fault / Fear Miss)、右側に Mindset(青)→ Culture(紫)→ Structure(緑)→ Process(紺)→ Fact-based Decisions(灰)のサイクルを矢印で示す。4 類型がどのサイクル要素で対応されるかを対応表として構造化した中心図。 **p.15 曖昧さの心理的安全** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-015.png]] 3 本柱: 「宣言を阻まない(Don't block people to declare)」「宣言に感謝する(Appreciate the declaration)」「事実ベースのトリアージ(Fact-Based Triage)」。右上のタグが No-CI / Near Miss / Fear Miss に適用されることを示す。 **p.16 ガット感覚への依存を減らす** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-016.png]] 3 戦略を 3 列で提示: (1) オブザーバビリティへの信頼構築 → 問題の影響を明確に見ることで事実ベース意思決定を可能にする(Near Miss 向け)。(2) グレーゾーンを可視化 → SLO で微細劣化パターンを早期検出(Near Miss / No-CI / Fear Miss 向け)。(3) 「ラッキーセーブ」を記録・タグ付け → Near Miss を可視化・レビュー可能にする。 **p.17 AI 支援のセルフサービス型インシデント対応** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-017.png]] Dynatrace Davis CoPilot の実画面: JavaScript エラー率上昇イベント(P-2508359)に対し、AI が根本原因(ArgoCD commit 934ac0 によるデプロイ)・影響範囲・6 段階の対処ステップを自動生成する例。"Explain with AI" ボタン → 構造化された説明が生成され、診断に対するガット感覚依存を下げる実装例として提示。 **p.20 Un-Incidents のレビュー方法** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-020.png]] フロー図: No-CI・Near Miss → 「簡単にトリガーできるようにする」→ Post-Incident-Analysis(紫)。Near Miss → 「軽量レビュー」→ Production Status Meeting(水色)→ Post-Incident-Analysis。Fear Miss・It's Not Our Fault → 既存 Incidents ルートを経由して Post-Incident-Analysis。 **p.22 ガイド付きエスカレーションパス** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-022.png]] Incident Process Reviews から得られた知見: 「代替手段がなかったため宣言された」インシデントが存在する → インシデント分類の見直し → 非インシデントサポートチャネル(バグプロセス / アシスタンス依頼 / 明確なタイムライン / エスカレーション選択肢)の提供、という 3 段フロー。 **p.24 NOF インシデントに基づくプロダクト設計パターン** ![[_attachments/2025__SREcon25EMEA__The-Un-Incident/page-024.png]] NOF インシデントがプロダクト改善の情報源になるという観点から、Impact ≠ Fault / 顧客視点で考える / ガードレールの重要性 / 共同責任 / 誤用を想定した設計 / 明確さがエスカレーションを防ぐ / 破壊的変更のサーフェシング、の 7 原則を青色の降順で列挙する。 ## Un-Incident 4 類型の詳細 | 類型 | 定義 | 典型例 | |---|---|---| | **No-CI** | 顧客影響はあるが非クリティカルであり、既存分類に当てはまらない | SLA 外の軽微な劣化 | | **NOF (Not Our Fault)** | 外部要因・ユーザー操作に起因し「自分たちのせいではない」と判断 | サードパーティ障害、設定ミス | | **Near Miss** | 幸運または予防的行動により宣言に至らなかった出来事 | 「ヒヤリハット」 | | **Fear Miss** | 不安・過剰反応による不必要なエスカレーション | 「ヘルプボタン症候群」 | Near Miss の参照リソースとして Deuschl は `surfingcomplexity.blog/2025/02/01/youre-missing-your-near-misses/`(Hollnagel らのレジリエンスエンジニアリング文脈)を挙げている(p.9)。 ## MTTD(Mean Time to Discuss) への言及 p.12 で「MEAN TIME TO DISCUSS(編注: ジョーク)」と冗談交じりに書かれているスライドがある。Un-Incidents の最大コストが「議論・分類論争に費やす時間」であることを揶揄しており、[[インシデントメトリクス]] の議論と通じる意識を示す。 ## 概念・実体への接続 - [[アンインシデント]] — 本発表の中心概念。4 類型の定義と Gray Zone Playbook を収録。 - [[インシデント管理]] — Un-Incident はインシデント管理プロセスの「入口の手前」にある盲点を扱う。 - [[Incident Commander]] — Gray Zone Playbook の「マインドセット」層は、IC の役割と重なる心理的安全の議論を含む。 - [[インシデントメトリクス]] — 「インシデントか否か」という分類論争コストへの批判は MTTR 批判と同根。 - [[インシデントシミュレーション]] — Near Miss の記録・レビューを訓練と接続できる。 - [[Dynatrace]] Davis CoPilot を AI 支援トリアージの実例として提示(p.17)。 ## 限界・不確実点 - 30〜60% の数値は "Source: own experience" のみ。外部データや研究との照合なし。 - transcript なし(Whisper 未取得、YouTube 動画 URL 未確認)。口頭説明・Q&A は不明。 - p.12 "40% of engineering time is productive" という小文字テキストの意味は画像から読み取れなかった(NOF インシデントとの関連が不明)。