## Memo
- [[2022__arXiv__Constructing Large-Scale Real-World Benchmark Datasets for AIOps]]より参照。
- 異常候補の集合から与えられた異常テンプレートに類似する異常を検索する
## Abstract
KPI(Key Performance Indicator)異常検知は、インターネットベースのサービスにおいて、品質と信頼性を確保するために非常に重要です。しかし、これらのアルゴリズムの学習や評価に役立つ十分なKPI異常データがないため、既存のアルゴリズムの現実の性能は満足のいくものとは言い難い。本論文では、このようなデータセットを取得するための主なハードルはラベリングオーバーヘッドであると主張する。
そこで我々は、ImageNetのような大規模KPI異常データセットを実現するために、ラベリングのオーバーヘッドを最小限に抑えるLabel-Lessという半自動ラベリングツールを新規に提案する。また、長いKPIをスキャンして異常パターンとラベルの整合性をチェックする手間を省くため、教師なし異常検知に[[Isolation Forest]]を、堅牢な異常類似性検索にUCR Suiteの加速[[DTW]]技術を採用することを提案する。大手インターネット企業の実際のKPI30個を用いた評価では、我々の異常類似性検索は平均0.95の最高のF-スコアと、KPIごとのリアルタイム応答時間(0.5秒未満)を達成しました。また、Label-Lessを実際に導入した結果、オペレータのラベリングオーバーヘッドを90%以上削減できることが確認されました。
[[2019__INFOCOM__Label-Less - A Semi-Automatic Labelling Tool for KPI Anomalies__translations]]