## Memo
- データセット
![[Pasted image 20240916131844.png|600]]
D2は[[2022 AIOps Challenge マイクロサービス・アーキテクチャの電子商取引システムにおける障害の識別と分類]]に使われた。
- ベースラインは、深層学習ではない手法([[2022__ICSE-SEIP__MicroHECL - High-Efficient Root Cause Localization in Large-Scale Microservice Systems|MicroHECL]]、[[2021__WWW__MicroRank―End-to-End Latency Issue Localization with Extended Spectrum Analysis in Microservice Environments|MicroRank]]、[[2020__WWW__AutoMAP - Diagnose Your Microservice-based Web Application|AutoMAP]]、[[2021__IWQOS__Practical Root Cause Localization for Microservice Systems via Trace Analysis|TraceRCA]]、[[2018__ICSOC__Microscope―Pinpoint Performance Issues with Causal Graphs in Micro-service Environments|Microscope]])と教師あり深層学習に基づく手法([[2022__ESEC-FSE__Actionable and Interpretable Fault Localization for Recurring Failures in Online Service Systems|De ́ja`Vu]]、[[2023__ICSE__Eadro - An End-to-End Troubleshooting Framework for Microservices on Multi-source Data|Eadro]]、[[2023__TSC__Robust Failure Diagnosis of Microservice System through Multimodal Data|DiagFusion]])が選択されている。
## Memo with LLM
## Abstract
大規模なマイクロサービスシステムにおいて、根本原因のインスタンスを正確かつ効率的に特定することは、最も重要である。 残念ながら、一般的な手法にはいくつかの限界がある。 特に、最近の手法の中には、教師あり学習に依存しているものがあり、これには相当量のラベル付きデータが必要である。 しかし、根本原因インスタンスのラベリングは、特にログ、トレース、メトリクスなどの複数のモダリティのデータでは、時間と手間がかかる。 上記の課題を解決するために、我々はマルチモーダルデータ解析に基づく新しい根本原因特定手法であるDeepHuntを提案する。 まずDeepHuntは、[[再構成誤差]]と故障伝播パターン(上流から下流までの関係)を統合することで根本原因スコア(RCS)を導入し、根本原因の特定に解釈可能性を付与する。 次に、グラフオートエンコーダー(GAE)を採用し、少ないラベルデータによる制限に対処する。 また、過去の学習サンプルの不足による悪影響を緩和するために、[[Data Augmentation|データ拡張]]を採用している。 DeepHuntを2つのオープンソースデータセットで評価したところ、ゼロラベルのコールドスタートに直面した場合、既存の手法を凌駕した。 DeepHuntは、フィードバックメカニズムを通じて継続的に微調整することで、さらに改善することができる。