## Memo ## Abstract マイクロサービス・アーキテクチャは、大規模アプリケーションで広く採用されている。しかし、マイクロサービスの膨大なデータ量と複雑な依存関係により、信頼性の高いパフォーマンスとメンテナンスの確保に新たな課題も生じている。既存のアプローチでは、データの過剰な集約、異常伝播による干渉、コンポーネントの違いの無視といった問題が依然として残っています。これらの問題を解決するために、本論文では、MicroNetと名付けられたオペレーション粒度での根本原因診断フレームワークを構築する。オペレーションはマイクロサービスのサブファンクションであり、呼び出し目的として記録されるため、オペレーション中心の視点を提案し、きめ細かなデータ集約とオペレーションレベルの異常バックトラックを実現する。診断タスクは、依存関係グラフの構築、異常検知、異常評価、犯人特定という4つのフェーズに分解される。呼び出し依存関係を正確に構築するために、集約可能な最小単位であるトリプル(呼び出し元、操作、呼び出し先)として定義されるメタコールの概念を提案する。依存関係グラフに基づき、操作の実行プロセスを分析することで操作の異常を定量化し、伝播した異常を逆探知する。そして、呼び出し遅延と異なる呼び出し関係を同時に考慮した根本原因を特定するために、[[Personalized PageRank]]アルゴリズムをカスタマイズする。オープンデータセットを用いた実験評価では、MicroNetが90%の平均平均精度で根本原因を効果的に特定でき、最先端の手法を凌駕することが示された。