[[2022__SSRN__Generic and Robust Root Cause Localization for Multi-Dimensional Data in Online Service Systems]]
#### 5.1.1. Datasets
我々は、2つの企業の2つの生産システムから数週間で収集した2つの実世界のデータセットを持っている。一つはオンラインショッピングプラットフォームのもの(I1とする)、もう一つはインターネット企業のもの(I2とする)である。これらは実世界のデータであるが、グランドトゥルースとして実世界の異常とそれに対応する根本原因を十分に入手することは困難である。そこで、これらの実世界データセットに故障を注入し、PSqueezeの評価を行う。注入された各故障の注入プロセスは以下の通りである。
1. 時系列からある時点を選択し、全葉の実数値に異なるガウスノイズを付加する。これは異なる予測残差をエミュレートするために使用される。
2. 2. n_element ∈{1, 2, 3}(略して`n_ele`)直方体をランダムに選択し、`cuboid_layer`で置換を行う。
3. 選択されたすべての直方体から、ランダムにn個の要素の異なる属性の組み合わせを選び、これをこの障害の根本原因の属性の組み合わせとする。なお,異なる前方残差のみを持つデータセット(すなわち,B1,B2,B3,B4を持つデータセット(すなわち、B1、B2、B3、B4)は、同じ時点を共有しているが、根本原因の属性の組み合わせが異なっていることに注意。
4. 選択された各根源属性の組み合わせについて、その子孫の葉のアトリビュート組み合わせの実数値をランダムなマグニチュードでGRE変更する。特に、成功率を指標とするDについては、まずGREによって成功率を修正する。そして、成功率に応じた総順序数と成功順序数をランダムに生成する。
5. GREは現実的な故障では完全には成立しないので、これらの降順葉属性組み合わせにガウスノイズ(N(0,5%))を追加する。
6. 次のような場合、無効な「故障」を削除する。
(a) 選択された根本原因の属性の組み合わせと同じ(または非常に類似した)降下葉の属性の組み合わせのセットを共有する別の属性の組み合わせが存在する。
(b) 正常なリーフ属性組み合わせ(すなわち、選択された根本原因属性組み合わせの子孫ではないリーフ属性組み合わせ)に注入されるガウスノイズが非常に大きく、それらの全体の測定値が異常である。
偏差値が異なる根本原因属性の組み合わせは、独立した複数の根本原因をシミュレートしている。なお、異なる根本原因属性の組み合わせの偏差値が同じになることもある。このような場合、偏差値が同じ根本原因属性の組み合わせは、複数の根本原因属性の組み合わせを含む1つの根本原因とみなされる。すべてのデータセットにおいて、ランダムな大きさの異常値を注入しているため、異常値の有意性は保証されない。
![[Pasted image 20220915172421.png]]
本論文では、我々の先行バージョン[6] ([[2019__ISSRE__Generic and Robust Localization of Multi-Dimensional Root Causes|Squeeze]])のインジェクションプロセスを拡張し、ステップ6を追加した。ステップ1∼5の処理では、評価対象として不適切な故障が生成される可能性がある。例えば、(A=a1∧B=b1∧C=c1)をランダムに選んで注入し、b1がc1に関係する場合を考える。この場合、(A=a1∧B=b1∧C=c1)、(A=a1∧B=b1)、(A=a1∧C=c1)はほぼ同じ葉属性の組み合わせの集合になる。したがって、(A=a1∧C=c1)や(A=a1∧B=b1)ではなく、(A=a1∧B=C=c1)を根本原因とするのは不合理であろう。しかし、すべての葉の属性組み合わせにガウスノイズを注入するため、図5に示すように、注入を意図していない属性組み合わせも異常となる。この問題に対処するため、我々の前バージョン[6]とは異なり、ステップ6で無効な故障を除去する。
![[Pasted image 20220915172631.png]]
生成されたデータセット。新しい注入方法によって,異なる故障注入パラメータを持つ6つの新しい注入データセットが得られた.表 4 では,これらのデータセットの基本統計量を示す.`n_ele` と `cuboid_layer`層の各組み合わせに対して,各データセットに 100 個の故障を注入した.したがって、合計で 5400 個の故障が存在することになる。表4において、nは属性数、|LE(φ)|は全リーフ属性組み合わせ数、|P(E)|は全根拠原因候補数、を示す。これらのデータセットには、基本尺度(表4でFと表記)と派生尺度(D)の両方を含む3つの異なる尺度が含まれており、これらはすべて共通のゴールデンシグナルである[14]。実際には、データ中に一度も出現しない属性の組み合わせはカウントしないため、|LE(φ)|と|P(E)|は理論結果よりも低くなっているようである。表4の残差は、すべての正常葉属性組み合わせの平均予測残差(%)を表す。EP (explanation power [10, 11]) は、すべての異常な葉の属性の組み合わせの予測残差の合計が、正常なものと異常なものの両方の予測残差に対する割合を示している。