[[TSifter実験 因果グラフ構築 20220320]]
- pgmpyとpcalgで比較する
- 得られたグラフは同じ
- [[ピアソン検定]]でもmemory_usage_bytesからs-front-end_latencyへの経路はないまま
- max_reach=1で、条件付き独立性検定の条件ノードを1個までにしても経路が切れる。
![[2022-03-24-causal_graph.png]]
- CI-testの組み合わせ結果。fisher-zとpearsonr
![[Pasted image 20220324153840.png|800]]
![[Pasted image 20220324153919.png|500]]
- s-front-end_latencyの条件下で、s-user_latencyとc-user_memory_usage_bytesが独立と判定されている。
大雑把には似たような変動を示す3変数にしぼってCI testを検証している。3変数とピアソン検定・fisher-z検定の各組み合わせに対して、網羅的に結果を整理したところ、 s-front-end_latencyを条件としたときに、s-user_latencyとc-user_memory_usage_bytesが独立であると判定されていることがわかった。
条件変数の影響を他の2変数から除去した上での相関をみるので、似たような変動を示す3変数であっても、独立になる組み合わせがあるのは当たり前か。
c-user_memory_usage_bytes -> s-user_latency -> s-front-end_latency となるのが正解なので、 連鎖経路とみなして、s-user_latencyを条件としたときに、c-user_memory_usage_bytesとs-front-end_latencyが条件付き独立になってほしいけど、なかなかそうはいかない。
- 似た変動を示していないnetwork系メトリクスをいれて条件付き独立性検定
- 完全には切れない
- c-orders-db_network_transmit_bytes_totalとその他の変数の相関係数がそれなりに大きく、非独立であると判定される。
- [[カイ二乗検定]]では、c-orders-db_network_transmit_bytes_totalを条件としたとき以外は、独立であると判定される。
![[Pasted image 20220326173052.png|600]]
![[Pasted image 20220326172759.png]]
![[Pasted image 20220326193659.png]]
- 形状類似度でCIしてもよい?
- 負の相関については、形状を反転させてみるとか?