[[20230313 AIOps交流会用スライド]] ## 参考文献 - ネットワークログの因果解析による障害の原因究明支援技術 - https://repository.dl.itc.u-tokyo.ac.jp/record/53402/files/A35221.pdf - 東大の博士論文 - ネットワークログをメトリクスに変換し、PCアルゴリズムで因果グラフ作成 - 条件付き独立性検定において、Fisher-Z検定とG2検定の比較評価を丁寧に行っている - [[2021__ACSOS__Causal Inference Techniques for Microservice Performance Diagnosis - Evaluation and Guiding Recommendations]] - https://hal.science/hal-03323055/document - 様々な因果探索手法を定量比較する論文 - [[2019__ISSRE__FluxRank―A Widely-Deployable Framework to Automatically Localizing Root Cause Machines for Software Service Failure Mitigation]] - https://netman.aiops.org/wp-content/uploads/2019/08/liuping-camera-ready.pdf - [[インシデント対応における故障発生から障害検知までの時間]] - 分析する時間ウィンドウを経験的に決定している論文 - [[2018__Middleware__Sieve Actionable Insights from Monitored Metrics]] - https://iakkus.github.io/papers/2017-middleware-thalheim.pdf - [[Granger因果性|Granger因果]]に基づき正常状態のシステムに対して因果グラフを作成する - [[2022__CSUR__Anomaly Detection and Failure Root Cause Analysis in (Micro)Service-Based Cloud Applications - A Survey]] - https://arxiv.org/pdf/2105.12378.pdf - AIOpsの障害検知と原因解析に関する大量の論文を調査して整理している論文 - 3.3 Causality Graph-based Analysis. に、因果グラフ構築とランダムウォークによる原因のランキング化に関する論文が紹介されている。 - [[2013__PER__Root Cause Detection in a Service-Oriented Architecture]] - http://i.stanford.edu/~mykim/pub/SIGMETRICS13-Monitoring.pdf - Linkedinの論文。この分野で後続の論文に引用されている基本となる論文の一つ。 - Personalized PageRankによるランダムウォークにより原因メトリクスをランキング化。 - 第三者によるOSS実装 - https://github.com/XLab-Tongji/RCAToolbox/blob/main/rca_model/monitor_rank_rca_model.py - [[AIOps - Fault Localization - MOC]] - AIOpsの原因診断系の論文集 - [[因果探索ライブラリ]] - Pythonを中心としたライブラリリンク集 - [[AIOps - MOC]] - AIOpsに関する調査内容のリンク集