RCAEval - yuuk1's Digital Garden

# RCAEval [[Luan Pham]] らがマイクロサービス RCA の標準ベンチマークとして整備してきた評価フレームワーク。最初は [[@2024__ASE__Root Cause Analysis for Microservices based on Causal Inference - How Far Are We]]([[Luan Pham]]・[[Huong Ha]] @ [[RMIT University]] と [[Hongyu Zhang]] @ [[Chongqing University]])のメトリクス系・因果推論ベース RCA 評価環境として登場し、その後 [[@2025__WWW Companion__RCAEval - A Benchmark for Root Cause Analysis of Microservice Systems with Telemetry Data]]([[Luan Pham]]・[[Huong Ha]]・[[Xiuzhen Zhang]] @ RMIT、[[Hongyu Zhang]] @ [[University of Newcastle]]、[[Flora Salim]] @ [[University of New South Wales]])でトレース系・マルチソース系・コードレベル障害まで拡張された。 - GitHub: https://github.com/phamquiluan/RCAEval - データセット: https://zenodo.org/records/13305663 - ソースコードアーティファクト: https://doi.org/10.5281/zenodo.13294049 - PyPI でインストール可能なライブラリとして配布。 ## 構成(2025 年 WWW Companion 版) - **データセット**: RE1(375 ケース、メトリクスのみ、CPU/MEM/DISK/DELAY/LOSS)・RE2(270 ケース、3 モダリティ、リソース 4 + ネットワーク 2)・RE3(90 ケース、3 モダリティ、コードレベル F1〜F5)。計 735 ケース・11 種の障害タイプ。 - **マイクロサービス**: [[Online-Boutique]](12 サービス・gRPC)・[[Sock Shop]](15 サービス・HTTP)・[[Train-Ticket]](64 サービス・HTTP+非同期)。 - **ベースライン 15 種**: メトリクス系(BARO・CausalRCA・CIRCA・RCD・MicroCause・EasyRCA・MSCRED・ε-Diagnosis・RUN)・トレース系(TraceRCA・MicroRank)・マルチソース系(PDiagnose・multi-source BARO/RCD/CIRCA)。 - **指標**: AC@k と Avg@k。coarse-grained(root cause service)と fine-grained(root cause indicator)の両粒度。 ## 関連 - ソース: [[@2024__ASE__Root Cause Analysis for Microservices based on Causal Inference - How Far Are We]] / [[@2025__WWW Companion__RCAEval - A Benchmark for Root Cause Analysis of Microservice Systems with Telemetry Data]] - 開発機関: [[RMIT University]] / [[University of Newcastle]] / [[University of New South Wales]] - 開発者: [[Luan Pham]] / [[Huong Ha]] / [[Hongyu Zhang]] / [[Flora Salim]] / [[Xiuzhen Zhang]] - 評価対象システム: [[Online-Boutique]] / [[Sock Shop]] / [[Train-Ticket]]