情報理論的異常スコア - yuuk1's Digital Garden

# 情報理論的異常スコア ## 定義情報理論的異常スコア（IT anomaly score; IT スコア）は、観測値の稀少性をイベント確率の負の対数で表した異常スコアであり、RCA 文脈での理論解析に適した較正（calibration）を持つ。特徴写像 $\tau: \mathcal{X} \to \mathbb{R}$ に対し、イベント $E := \{\tau(X_n) \geq \tau(x_n)\}$ を「$x_n$ と同等以上に極端な観測が起きる事象」と定義したとき、**周辺 IT スコア**は： $S(x_n) := -\log P(\tau(X_n) \geq \tau(x_n)) = -\log P(E)$ $P(E)$ は $H_0: X_n \sim P(X_n)$（正常機構から生成）という帰無仮説に対する p 値であり、$S(x_n)$ はその負の対数。スコアが大きいほど異常が強い。情報理論における「驚き度」（surprisal）と一致する定義であり、Hawkins (1980) や Aggarwal (2017) の外れ値分析の定式化とも整合する。(Source: [[@2025__NeurIPS__Root Cause Analysis of Outliers with Missing Structural Knowledge]]) **有限サンプル推定量**: $k$ 件の正常サンプル $x_n^1, \ldots, x_n^k$ があるとき： $\hat{S}(x_n^j) := -\log \frac{1}{k}|\{i \mid \tau(x_n^i) \geq \tau(x_n^j)\}|$ この推定量はコンフォーマル p 値の負の対数でもある（Bates+, Annals of Statistics 2021）。推定スコアは $\log k$ が上限であり、スコア $s$ を推定するには $e^s$ 件以上のサンプルが必要。 **条件付き IT スコア** は因果機構が変化したかどうかを検定するためのスコア： $S(x_n | pa_n) := -\log P(\tau(X_n) \geq \tau(x_n) | PA_n = pa_n)$ 親ノード $PA_n$ を所与の下で、$x_n$ がその因果機構 $P(X_n | PA_n = pa_n)$ から生成されたとする帰無仮説に対する p 値の負の対数。 ## スコア典型性（Score Typicality）二変数因果モデル $X \to Y$ における中心的な性質。観測 $(x, y)$ がスコア典型性を満たすとは： $S(y|x) \geq |S(y) - S(x)|_+$ ここで $|\cdot|_+$ は正部分（$\max(\cdot, 0)$）。この条件の下で： - **補題 3.3**: 周辺スコアだけから「$X$ が $Y$ の原因でない」という帰無仮説を $p \leq e^{-|S(y)-S(x)|_+}$ 水準で棄却できる - 意味: スコアが小さい異常が、より大きなスコアの異常を因果的に引き起こす確率は指数的に小さいスコア典型性が成立する条件: - 連続分布ならランダムに選んだ $x$ に対して高確率で近似的に成立（補題 3.4） - $S$ が単射かつ単調性条件を満たす場合は厳密に成立（補題 3.5）ポリツリーへの拡張（定義 3.10）：変数 $X_i$ の親集合 $PA_i$ に対して、合同スコア $S(pa_i)$ を Fisher の方法（独立した IT スコアの和＋アーラン補正）で構成することで、多変数ケースに帰着できる。 ## 横断的知見 - **IT スコアは p 値ベース検定と情報理論的解釈を統一する**: IT スコアの定義は情報理論の surprisal と統計的仮説検定の p 値を直接的に接続する。$S(x) = s$ とは「この観測が正常分布から生成される確率が $e^{-s}$ 以下」という意味であり、RCA では条件付きスコアと周辺スコアの差が「因果機構が変化したかどうか」の証拠として使える。この較正は Budhathoki ら [ICML 2022] の反実仮想 Shapley 分析と同じ枠組みを使っており、スコア差が直接貢献量の下界となることが証明されている（命題 A.4）。(Source: [[@2025__NeurIPS__Root Cause Analysis of Outliers with Missing Structural Knowledge]]) ## 未解決の問い - **推定サンプル数の実用的要件**: 補題 B.1 はスコア推定のサンプル複雑度を $k \propto (3eS_{\max}/\delta^2)\log(2n/\alpha)$ と与えるが、実世界の RCA では正常期間のデータが数百〜数千件に限られることが多く（PetShop タイ問題）、この理論的要件が実用的かどうかの調査が必要。 - **非連続分布への拡張**: 定理の多くは変数が連続分布を持つことを仮定する。ログカウントや離散イベントデータへの拡張可能性は未検証。 - **複数の特徴写像 $\tau$ の選択が結果に与える影響**: $\tau$ の選択（z スコア・分位数・ランク等）によってスコアの比較可能性がどう変わるか、実用的なガイドラインが未整備。 ## 関連 - [[因果推論ベースRCA]] — IT スコアが RCA に応用される主文脈 - [[単一サンプルRCA]] — IT スコアを使った単一サンプル RCA アルゴリズムの集約 - [[異常検知]] — IT スコアは異常スコアの一種。既存の任意の $\tau$ を使えるため既存の異常検知器と統合可能 - 関連ソース: [[@2025__NeurIPS__Root Cause Analysis of Outliers with Missing Structural Knowledge]] ## 出典 - [[@2025__NeurIPS__Root Cause Analysis of Outliers with Missing Structural Knowledge]](Orchard, Okati ほか, NeurIPS 2025 — IT スコアの定義・スコア典型性・サンプル複雑度の主要論文)