コールグラフあるいはネットワークトポロジを入力データとする故障箇所特定手法。
- [[2023__WWW__CMDiagnostor - An Ambiguity-Aware Root Cause Localization Approach Based on Call Metric Data|CMDiagnostor]]
- [[Call Metrics Data]]を使う
- [[2022__KDD__Causal Inference-Based Root Cause Analysis for Online Service Systems with Intervention Recognition|CIRCA]]
- [[2022__ASE__Graph based Incident Extraction and Diagnosis in Large-Scale Online Systems|He+, ASE2022]]
- [[2022__ICSE-SEIP__MicroHECL - High-Efficient Root Cause Localization in Large-Scale Microservice Systems|MicroHECL]]
- [[2021__ICSE__MicroDiag - Fine-grained Performance Diagnosis for Microservice Systems|MicroDiag]]
- [[2021__CLOUD__Causal Modeling based Fault Localization in Cloud Systems using Golden Signals]]
- [[2020__Applied Science__A Causality Mining and Knowledge Graph Based Method of Root Cause Diagnosis for Performance Anomaly in Cloud Applications|Qiu+, Applied Science2020]]
- [[2020__NOMS__MicroRCA - Root Cause Localization of Performance Issues in Microservices|MicroRCA]]
- [[2018__ICSOC__Microscope―Pinpoint Performance Issues with Causal Graphs in Micro-service Environments|Microscope]]
- [[2018__Middleware__Sieve Actionable Insights from Monitored Metrics|Sieve]]
- [[2014__INFOCOM__CauseInfer―Automatic and distributed performance diagnosis with hierarchical causality graph in large distributed systems|CauseInfer]]
- [[2013__PER__Root Cause Detection in a Service-Oriented Architecture|MonitorRank]]
- [[2013__ICDCS__FChain - Toward Black-box Online Fault Localization for Cloud Systems|FChain]]
- [[2009__CSMR__Automatic Failure Diagnosis Support in Distributed Large-Scale Software Systems based on Timing Behavior Anomaly Correlation|TBAC]]
[[2019__ISSRE__FluxRank―A Widely-Deployable Framework to Automatically Localizing Root Cause Machines for Software Service Failure Mitigation]]のイントロに言及がある。
> いくつかの研究[13-18]は、コンピュータネットワークにおける根本原因のローカライズに焦点を当て、依存関係はネットワークトポロジ内のリンクから推論される。しかし,ソフトウェアサービスの依存関係グラフは,この方法では推論することができない.
> Sherlock[8]は、各ホストにエージェントを配置し、依存関係グラフを推定し、同じクライアントからのログや異なるクライアント間の相関を分析することにより、根本原因を特定する必要がある。[[2013__PER__Root Cause Detection in a Service-Oriented Architecture|MonitorRank]] [9]は、トレースログを利用して依存関係グラフを構築し、ランダムウォークアルゴリズムにより根本原因を特定します。[[2014__INFOCOM__CauseInfer―Automatic and distributed performance diagnosis with hierarchical causality graph in large distributed systems|CauseInfer]] [10]は、ワイヤーキャプチャされたサービスコールを用いてサービス依存グラフを構築し、[[PCアルゴリズム]] [19]を適用してメトリック因果グラフを構築し、2レベルのグラフを横断して根本原因を特定する。[[2013__ICDCS__FChain - Toward Black-box Online Fault Localization for Cloud Systems|FChain]] [11]は、Sherlock [8]のアルゴリズムにより依存関係グラフを構築する。BRCA [12]は、サービスの過去のKPI異常アラートに基づいて依存関係グラフをマイニングする。
[[2023__TDSC__DyCause - Crowdsourcing to Diagnose Microservice Kernel Failure]] では、
- [[2013__PER__Root Cause Detection in a Service-Oriented Architecture|MonitorRank]]
- TBAC
- [[2018__ICSOC__Microscope―Pinpoint Performance Issues with Causal Graphs in Micro-service Environments|Microscope]]
- [[2020__NOMS__MicroRCA - Root Cause Localization of Performance Issues in Microservices|MicroRCA]]