## Memo
- 実験には[[2023__arXiv__PyRCA - A Library for Metric-based Root Cause Analysis|PyRCA]]を用いている。
## Memo with LLM
## Abstract
クラウドコンピューティングとデータセンターの拡大に伴い、環境への影響に取り組む必要性が生じている。 この研究では、(コンテナ化された)マイクロサービスシステムの異常検知(AD)と根本原因分析(RCA)のアルゴリズムのエネルギー消費に関する有効性を実験的に分析する。 本研究では、5つのADと3つのRCAアルゴリズムを分析する。 ADアルゴリズムの有効性を評価する指標は、Precision、Recall、F-Scoreである。 RCAアルゴリズムでは、レベルkでのPrecisionが選択される: [[Sock Shop]]とUNI-Cloudである。 実験はクロスオーバーの一対比較デザインを使用し、ロバストな測定のために複数回の無作為化実行を含む。実験は、ADアルゴリズムが比較的中程度の性能を示すことを示している。 Sock Shopの平均調整済みPrecisionは61.5%であり、UNI-Cloudで最も良いパフォーマンスを示したアルゴリズム([[BIRCH]]、[[k-最近傍法|k-NN]]、[[サポートベクターマシン|SVM]])では75%である。 UNI-CloudのRecallとF-Scoreは同じアルゴリズムで75%であるのに対し、Sock ShopではKNNが約45%で最良の結果となった。 我々はADアルゴリズムの有効性が異常しきい値に強く影響されることを発見し、このようなアルゴリズムを注意深くチューニングすることの重要性を強調した。 RCAアルゴリズムは有望な結果を示し、特に[[2022__NeurIPS__Root Cause Analysis of Failures in Microservices through Causal Discovery|RCD]]と[[2020__NOMS__MicroRCA - Root Cause Localization of Performance Issues in Microservices|MicroRCA]]は堅牢な性能を示した。 しかし、[[2019__WWW__ε-Diagnosis - Unsupervised and Real-time Diagnosis of Small-window Long-tail Latency in Large-scale Microservice Platforms|ε-Diagnosis]]アルゴリズムに見られるような課題も残っており、さらなる改良の必要性が示唆されている。DevOpsエンジニアにとって、この調査結果は、ADとRCAアルゴリズムをエネルギー用に慎重に選択・調整し、システムのトポロジーと監視構成を考慮する必要性を浮き彫りにしている。