## Memo
- ジャーナル版:[[2025__TSEM__Failure Diagnosis in Microservice Systems - A Comprehensive Survey and Analysis]]へ
![[Pasted image 20241025075715.png|600]]
## Memo with LLM
## Abstract
最新のマイクロサービスシステムは、その高いスケーラビリティ、柔軟性、拡張性により広く採用されている。 しかし、独立したデプロイメント、分散化、頻繁な動的相互作用の特性は、カスケード障害のリスクをもたらし、正確な障害診断と迅速なシステム復旧を達成することを困難にしています。これらの問題は、運用効率とユーザーエクスペリエンスに深刻な影響を与える。 マイクロサービスシステムの安定性と信頼性を高める上で、障害診断が極めて重要な役割を果たすことを認識し、研究者は広範な研究を実施し、一連の重要な成果を達成してきた。 本サーベイでは、2003年から現在までの94の論文を包括的にレビューし、基本概念の概要、研究の枠組み、問題提起を含む一次分析を行う。これらの洞察は、研究者が故障診断における最新の研究進展を理解するのに役立つことを目的としている。 また、一般に公開されているデータセット、ツールキット、評価指標をまとめ、実務家が様々な技術を選択し、検証する際に役立つようにし、現在の実務を越えてこの分野を発展させる基盤を提供する。