#tsifter ## 実験条件 - argowf-chaos-9tznf の異常データを使用。 - ネットワークの遅延またはロスのchaosを注入している。 - tsifterでフィルタリング後に、ルートメトリック(s-front-end_latency)が残留しているもののみ、因果グラフを構築。 ## 実験結果 - `argowf-chaos-9tznf/carts-db_pod-network-latency_0.json/tsifter-2021-07-19-argowf-analytics-jdn9r.json'` - ![[20210719_170841.png]] - carts-dbが消えてしまっている - `'argowf-chaos-9tznf/user-db_pod-network-loss_0.json/tsifter-2021-07-19-argowf-analytics-jdn9r.json'` - ![[20210719_173227.png]] - s-front-end_latencyからたどれない - `'argowf-chaos-9tznf/user-db_pod-network-latency_0.json/tsifter-2021-07-19-argowf-analytics-jdn9r.json'` - ![[20210719_173832.png]] - 途中で切れている - `'argowf-chaos-9tznf/front-end_pod-network-loss_0.json/tsifter-2021-07-19-argowf-analytics-jdn9r.json'` - ![[20210719_174526.png]] - `argowf-chaos-9tznf/shipping_pod-network-loss_0.json/tsifter-2021-07-19-argowf-analytics-jdn9r.json'` - ![[20210719_174821.png]] - s-front-end_latencyからたどれない - shipping networkがない - `argowf-chaos-9tznf/orders-db_pod-network-latency_0.json/tsifter-2021-07-19-argowf-analytics-jdn9r.json` - ![[20210719_175354.png]] ## 所感 - ルートメトリック(s-front-end_latency)から、DAGを矢印に向かって、辿ると、原因メトリックまで辿れなくなる。 - 原因メトリックが消失しているケースがある。 - 三角形の部分グラフができてしまう。3コンポーネントが互いに依存するというケースはあまりないはず。 - コンポーネントA メトリックX -> コンポーネントB メトリックY -> コンポーネントA メトリックZ のように、コンポーネント単位でみると、閉路ができている。 - このような異常の影響の伝播の仕方は、現実にありえるが、障害対応時には冗長な情報になるのではないか。