# AlertGuardian
[[Sun Yat-sen University]] と [[Tencent]] が開発した、アラートライフサイクル管理フレームワーク(ASE 2025 の experience paper)。LLM と軽量グラフモデルを協調させ、3 フェーズでアラート疲弊(alert fatigue)を緩和する。(Source: [[@2025__ASE__AlertGuardian - Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems]])
3 フェーズ:
- **Alert Denoise**: グラフ学習モデル **GraphGuardian**(LINE + Transformer)と毎分発火する仮想ノイズノード、高基数属性の匿名化で、オンラインに 200 ミリ秒未満でノイズを除去。4 データセットで 93.82〜95.50% のアラート削減率。
- **Alert Summary**: RAG + DeepSeek V3 で内部知識(システム文書・ルール解説・インシデントチケット)を注入し、Root Cause・Explanation・Solution・Reference を含む行動指針付き要約を生成。Action 精度 98.5%・RCA 90.5%。
- **Alert Rule Refinement**: オーケストレータなしのマルチエージェント(Detect/RAG/Rule/Review)が Rule Deduplication・Rule Aggregation・Threshold Adjustment・Temporal Analysis の 4 方策で既存ルールを反復精錬。1,174 ルール提案・375 件受容(32%)。
本番投入(2024 年 2 月〜、Tencent の System A)で日次 30 万アラートを約 1.5 万へ削減し、MTTR を 156 分から 21 分へ短縮(7.4 倍)。
## 関連
- ソース: [[@2025__ASE__AlertGuardian - Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems]]
- 開発: [[Sun Yat-sen University]] / [[Tencent]]
- 主要著者: [[Guangba Yu]] / [[Pengfei Chen]]
- 概念: [[AIOps]] / [[インシデント管理]] / [[異常検知]] / [[根本原因分析]]