## Memo
## Memo with LLM
## Abstract
マイクロサービス・アーキテクチャの使用は、ウェブ・アプリケーションの開発で人気を集めている。しかし、相互接続されたマイクロサービスの複雑さ、長いサービス呼び出しリンク、サービス状態の動的な変化、およびサービス展開ノードの多さにより、障害の根本原因を特定することは困難な場合があります。さらに、各マイクロサービスは複数のインスタンスを持つ可能性があるため、マイクロサービスのトポロジーと障害タイプが動的に変化する場合、インスタンスレベルの障害を迅速かつ効果的に特定することは困難です。この問題に対処するために、我々はMicroIRC(Instance-level Root Cause Localization for Microservice Systems)を提案する。MicroIRCは、インスタンスレベルで根本原因を特定する新しいメトリクスベースのアプローチであり、トポロジーの動的な変化や新しいタイプの異常に適応するロバスト性を示す。まず、抽出されたマイクロサービスシステムのメトリクスの時系列特徴に基づいて、異なる根本原因のタイプに適合する[[Graph Neural Network]]をトレーニングする。次に、マイクロサービスシステムの異種加重トポロジー(HWT)を構築し、個別化ランダムウォークを実行して根本原因の候補を特定する。これらの候補は、異常な時間ウィンドウからのリアルタイムのメトリクスとともに、ランク付けされた根本原因リストを生成するために、学習されたグラフニューラルネットワークに供給される。実世界の 5 つのデータセットで実施した実験では、MicroIRC がマイクロサービスの根本原因をインスタンスレベルで正確に特定できることが実証され、上位 5 つの結果に対して 93.1% の精度を達成しました。さらに、最先端の手法と比較して、MicroIRC は根本原因の特定精度をサービス レベルで 17% 以上、インスタンス レベルで 11.5% 以上向上させることができます。驚くべきことに、MicroIRCは新しいタイプの障害を含むシナリオにおいて頑健性を示し、動的なトポロジーの変化の中でトップの結果に対して84.2%の精度を達成した。