## Memo - 実験はクラウドサービスを対象に行われている。 - "Root Causes of Observed Latencies in Cloud Services" ## Abstract 原因プロセスにおける異常の根本原因を特定することは、分野横断的に重要である。一旦特定されれば、根本原因を切り分け、正常な動作を回復するために必要な対策を実施することができる。因果プロセスは、エンティティをノード、それらのパス/相互接続をエッジとするグラフとしてモデル化されることが多い。既存の研究では、生成プロセスにおけるノードの寄与のみを考慮するため、異常が接続で発生した場合、異常値スコアをメカニズムのエッジに帰属させることができない。本論文では、根本原因を特定する際に、各メカニズムの個々のエッジとノードの両方を考慮する。そのためにノイズの多い関数的因果モデルを導入する。そして、ノードとエッジのノイズを推論するために、ベイズ学習と推論手法を用いる。そして、ノードとエッジのノイズの関数として、対象となる葉の関数形を表現する。最後に、ノードとエッジの数に対して線形にスケールする、効率的な勾配に基づく異常帰属スコアを計算する方法を提案する。シミュレーションデータセットと2つの実世界シナリオデータセットを用いた実験により、提案手法がベースラインと比較して優れた異常帰属性能を持つことを示す。本手法は、より多くのノードとエッジを持つより大きなグラフに対しても拡張可能である。