# 情報量基準メトリクス選定 ## 定義 情報量基準メトリクス選定(Informative Metric Subset Selection)は、観測可能メトリクス集合 σ から「個別の情報量(エントロピー H)が高く、相互の冗長性(相互情報量 M)が低い」最小部分集合 Γ ⊂ σ を選ぶ問題。SRE がアラート定義の前段で「どのメトリクスを監視するか」を決める作業を自動化することが目的。[[@2025__arXiv__Metric Criticality Identification for Cloud Microservices|Singal+ arXiv2025]] が Informative Metric Subset Problem として形式化し、最大重み付きクリーク問題からの帰着で NP 完全であることを証明した。(Source: [[@2025__arXiv__Metric Criticality Identification for Cloud Microservices]]) 問題形式: ``` Γ*A = argmax_ΓA (Σ_{m∈M} Σ_{ψ∈ΓA(m)} H(ψ)) / Σ_{m∈M} |ΓA(m)| subject to: 1. ΓA(m) ⊆ Ψm 2. ∀ψ1 ≠ ψ2 ∈ ∪ ΓA(m) : M(ψ1, ψ2) ≤ ϵ 3. Σ |ΓA(m)| ≤ χ ``` 平均エントロピーを最大化することで、低エントロピーメトリクスを多数選ぶ盤外解を排除する。 ## 横断的知見 - (1 ソース目: Singal+ arXiv2025 のみ) ## 未解決の問い - 既存の特徴量選択手法(SelectKBest・mRMR・Boruta)は機械学習タスクの「ラベルとの相関」を最大化するが、オブザーバビリティのメトリクス選定は「監視すべき情報量」を最大化する別問題。両者の評価軸統合は未着手。 - 「マイクロサービストポロジの確率」を陽に取り込む選定は [[KIMetrix]] が初。他のオブザーバビリティ系プロダクト(Datadog APM・Honeycomb など)で類似の topology-aware 削減を提供する報告はあるか。 - 情報量基準と [[Quality of Alerts]](indicativeness・precision・handleability、Yang+ DSN2022)の関係は明らかでない。情報量が高い ≠ アラート品質が高い、の可能性を計測した研究はまだない。 ## 関連 - 親概念: [[アラート管理]]・[[オブザーバビリティ]] - 関連実装: [[KIMetrix]](Singal+ arXiv2025) - 関連特徴量選択: SelectKBest・mRMR・Boruta(従来手法、本論文でベースライン) - ソース: [[@2025__arXiv__Metric Criticality Identification for Cloud Microservices]] ## 出典 - [[@2025__arXiv__Metric Criticality Identification for Cloud Microservices]] §II。