## Memo
- [[2022__arXiv__Heterogeneous Anomaly Detection for Software Systems via Attentive Multi-modal Learning]]の後継論文?
- [GitHub - BEbillionaireUSD/Hades](https://github.com/BEbillionaireUSD/Hades/)
## Structure
### 1. Standpoints
- 直感的には、異なるモニ タリングデータソースを組み合わせることで、ランタイム情報 を十分に活用し、システムの状態を全体的に分析することができる。
- 既存のデータセットに対して、豊富なセマンテ ィクスとアノテーション(すなわち、異常か否か)を持つ時間的 に整列した異種実行時情報
- [[2021 AIOps Challenge クラウド環境における商業銀行アプリケーションのリアルタイム障害検知と原因究明]]
- [[2020__Loghub - A Large Collection of System Log Datasets towards Automated Log Analytics]]
### 2. Contributions
- 異常の発現におけるログとメトリク スの協調的かつ補完的な関係をはじめて指摘
- 異種監視データに基づくシステムの異常をクロスモーダルなアテンションによって効果的に検出する初のエン ドツーエンド半教師付きアプローチHadesの提案
- Apache Sparkへの様々なワークロードを実行し、21種類の典型的な故障を注入
### 3. Results
### 4. Methods
## Abstract
ソフトウェアシステムの信頼性を確保するためには、システムの異常を迅速かつ正確に検出することが不可欠である。しかし、既存のアプローチは、利用可能なすべてのランタイム情報を活用する手作業とは異なり、通常、単一のタイプの監視データ(多くの場合、ログまたはメトリック)のみを活用するか、異なるタイプのデータ間の共同情報を有効に利用することができません。その結果、多くの誤った予測が発生しています。システムの異常の兆候をより良く理解するために、我々は大量の異種データ、すなわちログとメトリクスについて体系的な研究を実施した。その結果、ログとメトリクスは協調的かつ相補的にシステムの異常を顕在化させることができ、どちらか一方だけでは不十分であることが明らかになった。このように、異種データの統合は、システムの健全性の全体像を回復するのに役立つ。このような背景から、我々は、異種データに基づくシステムの異常を効果的に特定する、初のエンドツーエンド半教師付きアプローチであるHadesを提案する。本アプローチは、ログのセマンティックとメトリックパターンを融合することにより、システム状態のグローバル表現を学習する階層的なアーキテクチャを採用している。また、半教師付きで学習されたクロスモーダルアテンションモジュールにより、異種データから識別可能な特徴や意味のある相互作用を獲得することができる。我々は、Hadesを大規模なシミュレーションデータとHuawei Cloudのデータセットで広範囲に評価しました。実験結果は、システム異常の検出における我々のモデルの有効性を示しています。また、複製と将来の研究のために、コードと注釈付きデータセットを公開する。
## 1. Introduction