## Memo - [[NetManAIOps]]研究グループからの国際会議論文。 ## Abstract オンラインソフトウェアサービスにおいて、大規模な多次元データを用いた根本原因分析(MDRCA)は極めて重要です。MDRCAは、オペレータが異常や障害の範囲を迅速に絞り込み、根本原因をより細かい粒度にまで特定するのに役立ちます。しかし、既存のMDRCAアルゴリズムのほとんどは、低次元の問題しか解決することができません。高次元のデータを扱う場合、これらのアルゴリズムの複雑さは著しく増大し、一部のアルゴリズムが機能しなくなることさえあります。直感的には、完全な属性ではなく、属性のサブセットのみを渡すことで、これらのMDRCAアルゴリズムの性能を向上させることができます。しかし、データのアンバランスや新規の根本原因属性のために困難である。根本原因指向属性選択(RCOAS)の問題をより良く理解するために、我々は実世界のデータに基づいた予備的な研究を行う。我々は、いくつかの属性をフィルタリングするためのいくつかの簡単なルールが存在することを見出した。さらに、既存のアプローチはRCOASの要件に適合しないことを明らかにする。本研究では、下流アルゴリズムに必要な属性を選択するためのRCOASアプローチであるRC-LIRを提案する。RC-LIRはまず、ルールベースの選択を行う。次に、アンバランスなデータのスケールアップと冗長なコストを考慮するという2つの戦略によって特徴選択アルゴリズムを改善する。1000件の実故障事例を用いた実験では、RC-LIRはF1スコア0.88を達成し、ベースラインアプローチを少なくとも0.15上回った。さらに、広く採用されている4つのMDRCAアルゴリズムとの実験により、RC-LIRを統合することで、より効果的かつ効率的なMDRCAを実現できることが示された。 [[2022__ISSRE__Effective Attribute Selection for Multi-dimensional Root Cause Analysis__translations]]