[[AIOps]]の[[Root Cause Analysis|RCA]]、Fault Localizationの先行手法のうち、特徴量削減処理を調査し、整理する。
## 時系列データに対する自動特徴量削減
| Reference | Type | Time Scale | Method | Needed Tuning by Metric Type | Needed Normal Duration | | |
|:--------------:| ---- | ---------- | ---------------------------------------------- | ---------------------------- | ---------------------- | --- | --- |
| ε-Diagnosis | NR | Online | エネルギー距離相関に基づく2標本検定 | N | Y | | |
| PatternMatcher | NR | Online | 2標本のKolmogorov–Smirnov(K-S)検定 | N | Y | | |
| FluxInfer | NR | Online | 混合ガウス分布によるクラスタリング | N | N | | |
| FluxRank | NR | Online | カーネル密度推定 | Y | | | |
| CauseRank | NR | Online | Z-score | | | | |
| TS-InvarNet | RR | Offline | 距離尺度をSBDとしたHDBSCANによるクラスタリング | N | - | | |
| FluxRank | RR | Online | DBSCANと相関に基づくクラスタリング | N | - | | |
| Sieve | RR | Offline | k-Shapeによるクラスタリング | N | - | | |
| CauseInfer | RR | Online | ペアワイズ相関 | N | - | | |
- NR 正常メトリクスの除去
- RR 冗長なメトリクスの除去
- Needed Tuning by Metric Type:メトリクス種別ごとの調整が必要であるかどうかを示す。
- Needed Normal Duration:異常検知にて正常期間の標本が必要であるかどうかを示す。
## 列挙
- [[2022__ICWS__TS-InvarNet - Anomaly Detection and Localization based on Tempo-spatial KPI Invariants in Distributed Services|TS-InvarNet]] (2022)
- オフラインの解析で、[[Shape-based distance|SBD]]と[[HDBSCAN]]を使っている。
- [[2019__WWW__ε-Diagnosis - Unsupervised and Real-time Diagnosis of Small-window Long-tail Latency in Large-scale Microservice Platforms|ε-Diagnosis]] (2019)
- エネルギー相関
- [[2021__ISSRE__Identifying Root-Cause Metrics for Incident Diagnosis in Online Service Systems|PatternMatcher]] (2021)
- [[K-S検定]]
- [[2020__IPCCC__FluxInfer―Automatic Diagnosis of Performance Anomaly for Online Database System|FluxInfer]] (2020)
- 異常検知と変化点検知
- クラスタベースのロバストな異常検知アルゴリズム
- [[混合ガウス分布]]
- KPI値を異なるセグメントに分割し、ノイズの多いセグメント、異常なセグメント、正常なセグメントを正確に分けることができる
- [[2019__ISSRE__FluxRank―A Widely-Deployable Framework to Automatically Localizing Root Cause Machines for Software Service Failure Mitigation|FluxRank]] (2019)
- 異常検知は[[カーネル密度推定|KDE]]でメトリクスの種類ごとに関数選択と帯域幅のチューニング
- 絶対微分による変化開始点の検出
- 変化開始点以降が検証データ、それ以前を学習データとわける?
- 障害開始時刻以後に変化開始点をもつメトリクスは除去
- [[DBSCAN]]と[[ピアソン相関係数|ピアソンの相関]]によるクラスタリング
- [[2018__Middleware__Sieve Actionable Insights from Monitored Metrics|Sieve]] (2018)
- [[2015__SIGMOD__k-Shape - Efficient and Accurate Clustering of Time Series|k-Shape]]
- [[2014__INFOCOM__CauseInfer―Automatic and distributed performance diagnosis with hierarchical causality graph in large distributed systems|CauseInfer]] (2014) [[2016__TSC__CauseInfer―Automated End-to-End Performance Diagnosis with Hierarchical Causality Graph in Cloud Environment]] (2016)
- ピアソン相関による冗長メトリックの除去
- The metric selection is conducted in a simple pair-wise manner: if the absolute value of the Pearson correlation coefficient of two metrics exceeds a preset threshold, say 0.8 in this paper, one of them is eliminated.
- ベイズ型変化点検知 [[BCP]]
- 時系列データをバイナリへ変換 => G2検定へ
- [[2021__ACSOS__Causal Inference Techniques for Microservice Performance Diagnosis - Evaluation and Guiding Recommendations]]
- [[BIRCH]]
- [[2022__CCGrid__Generic and Robust Performance Diagnosis via Causal Inference for OLTP Database Systems|CauseRank]]
- [[z-scoreとn-sigmaによる異常検知]]
- [[CauseRankのメトリクスの異常検知コード]]