## Memo
- [[Transtracer]]のようなネットワークトポロジーデータを使う。
## Abstract
ITインフラの発達に伴い、アプリケーションやシステムから発生するデータの津波は増え続けています。従来のIT管理ソリューションでは、その量と複雑さに対応しきれませんでした。IT運用のための人工知能([[AIOps]])は、複雑な現代のIT環境において、IT運用管理を簡素化し、問題解決を加速・自動化する非常に有効な方法です。アラームの根本原因の特定は、AIOpsの重要なシナリオであり、重要な機能です。現在、アラーム履歴データのアソシエーションマイニング、アラームルールの作成、オフラインアラーム圧縮処理などが主な研究対象になっています。しかし、実用的なアプリケーションでは、より速く、より正確なアラームの根本原因を特定する必要があり、そのリアルタイム性能に高い要求を突きつけることができます。本論文で提案するオンラインリアルタイムアラーム根本原因特定アルゴリズムは、アラーム関連時間、アラームイベント分割、アラームイベントトポロジー生成などの技術を通じて、時間と空間の次元でアラーム間の関係を十分に探索し、オンラインアラームデータ圧縮を達成することができます。アラームイベントのリアルタイムでの正確な分割と、重要なアラームのリアルタイムでの位置特定により、根本原因の特定速度と精度を大幅に向上させることができます。本アルゴリズムは、モバイルネットワーク事業者の5Gネットワーク管理システムで起動されました。提案アルゴリズムの適用により、1分間に1万件以上のアラームが処理され、アラームの根本原因の精度は85%に達し、良好なオンライン効果を実現しました。
[[2021__BigData__TTERCL - An onSite Real-time Alarm Root-Cause Location Algorithm__translations]]