## Memo
![[Pasted image 20240209162227.png]]
## Abstract
効果的な根本原因分析(RCA)は、サービスを迅速に復旧し、損失を最小限に抑え、複雑なシステムの円滑な運用と管理を確保するために不可欠である。これまでのデータ駆動型RCA手法、特に原因究明技術を用いた手法は、根本原因を遡るための依存関係グラフや因果関係グラフの構築に主眼を置いてきた。しかし、これらの手法は、単一のモダリティからのデータのみに依存しているため、しばしば不十分であり、その結果、最適解が得られない。本研究では、マイクロサービスシステムの根本原因を特定するために設計された、統一されたマルチモーダル因果構造学習手法であるMulanを提案する。我々は、ログ表現学習を促進するために、ログに合わせた言語モデルを活用し、ログシーケンスを時系列データに変換する。異なるモダリティにまたがる複雑な関係を探索するために、共有された潜在空間内のモダリティ不変表現とモダリティ固有表現を抽出する、[[対照学習]]に基づくアプローチを提案する。さらに、モダリティの信頼性を評価し、最終的な因果グラフを共同学習するための、新しい重要業績評価指標を意識した[[Attention機構|注意機構]]を導入する。最後に、システムの故障伝播をシミュレートし、潜在的な根本原因を特定するために、再起動を伴うランダムウォークを採用する。3つの実世界データセットを用いた広範な実験により、提案手法の有効性を検証する。