## Memo ## Memo with LLM ## Abstract スケーラビリティと柔軟性のために広く採用されている最新のマイクロサービスシステムは、その独立したデプロイと動的な相互作用のために、ユニークな障害診断の課題を提示します。この複雑さは、運用効率とユーザーエクスペリエンスに悪影響を与えるカスケード障害につながる可能性があります。マイクロサービスシステムの安定性と信頼性の向上における障害診断の重要な役割を認識し、研究者は広範な研究を実施し、多くの重要な成果を達成してきました。本調査では、2003年から現在までの98の科学論文を網羅的にレビューし、基本概念、システムアーキテクチャ、問題文の徹底的な検討と解明を行う。また、その次元の質的分析も行い、現在のベストプラクティスと将来の方向性についての詳細な議論を提供し、さらなる発展と応用を目指している。さらに、本調査では、実務家がテクニックの選択と検証を容易に行えるよう、一般に公開されているデータセット、ツールキット、評価指標をまとめた。