# LogCleaner [[Peking University]] の [[Lingzhe Zhang]]・[[Tong Jia]]・[[Ying Li]] らと [[Alibaba Group]] の [[Kangjin Wang]] が提案した、ログベース[[異常検知]]の自動イベント削減ミドルウェア(ESEM 2024)。 ソフトウェアシステムと異常検知モデルの間に位置し、TF-IDF によるまれなイベントの除去、相互情報量(MI)による anti-event の除去、OPTICS クラスタリングによる duplicative-event の除去の 3 段で、生ログから不要イベントを自動的にフィルタリングする。プロファイリング(オフライン)とオンラインフィルタリングの 2 フェーズで動作し、コード変更時に再プロファイリングで適応する。 6 モデル×3 データセットの評価で 70% 超のイベント削減・推論速度約 300% 向上・モデル性能の普遍的改善を達成。Apache IoTDB に適用し、50% 超の不要ログ print 文の発見とシステム性能約 8% 向上の実績を持つ。 ## 関連 - ソース: [[@2024__ESEM__Reducing Events to Augment Log-based Anomaly Detection Models - An Empirical Study]] - 著者: [[Lingzhe Zhang]] / [[Tong Jia]] / [[Kangjin Wang]] / [[Ying Li]] - 概念: [[異常検知]] / [[ログ解析]] / [[ログパース]]