[[20230324 TSifterの統合評価内容]]の結果。 - Neptuneで統合評価結果をだすように [https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/compare?viewId=98d90663-e5d7-4b70-a9de-9264979cd596&detailsTab=metadata&shortId=TSDRLOC-173&dash=leaderboard&type=run&compare=IwdgzANMU9ew%2BTEuW1G5A](https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/compare?viewId=98d90663-e5d7-4b70-a9de-9264979cd596&detailsTab=metadata&shortId=TSDRLOC-173&dash=leaderboard&type=run&compare=IwdgzANMU9ew%2BTEuW1G5A) - 統合評価内容 - 次元削減 + {PCアルゴリズムによる因果グラフ、コールグラグ、完全グラフ} + MonitorRank - PCアルゴリズムすら使わない手法も含めているところがポイント - 下記の組み合わせを総当りで評価指標を計算する - 次元削減レイヤ 1. フェーズ1+2 2. フェーズ1のみ 3. フェーズ2のみ - フェーズ1の種類 1. K-S検定 2. ε-Diagnosis 3. FluxInfer-AD 4. 提案手法 - フェーズ2の種類 - クラスタリングアルゴリズム - 階層型クラスタリング (閾値0.0.2) - DBSCAN (FluxRank) - HDBSCAN - 距離尺度 - SBD - ピアソン相関係数 - 因果グラフ構築レイヤ - PCアルゴリズム - 条件付き独立性検定 alpha=0.5 - 条件なし2変数独立性検定 alpha=0.5 - 事前知識(ネットワークのコールグラフあり)によるエッジ削除あり or なし - コールグラフ - 完全グラフ - ランダムウォークレイヤ - MonitorRank - 評価指標 - 精度 → AC@K, AVG@K - 故障箇所特定粒度 → metric, container, service - [https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/table?viewId=98db34c8-1afd-4ede-81e6-34c83f2b3feb&detailsTab=metadata&shortId=TSDRLOC-173&dash=leaderboard&type=run&compare=IwdgzANMU9ew%2BTEuW1H1cz7feZA](https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/table?viewId=98db34c8-1afd-4ede-81e6-34c83f2b3feb&detailsTab=metadata&shortId=TSDRLOC-173&dash=leaderboard&type=run&compare=IwdgzANMU9ew%2BTEuW1H1cz7feZA) - 2変数独立性検定と完全グラフがよい結果 - 完全グラフ - fluxrank_sbd_medoid_only_ctnrs https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/details?viewId=98db34c8-1afd-4ede-81e6-34c83f2b3feb&shortId=TSDRLOC-204&type=run&compare=IwdgzANMU9ew%2BTEuW1H1cz7feZA - fluxrank_pearsonr_medoid_only_ctnrs https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/details?viewId=98db34c8-1afd-4ede-81e6-34c83f2b3feb&shortId=TSDRLOC-203&type=run&compare=IwdgzANMU9ew%2BTEuW1H1cz7feZA - hierarchy-single_sbd_medoid_only_ctnrs ## FluxRank + SBD + medoid + complete graph https://new-ui.neptune.ai/html-renderer/?experimentIdentifier=98daf880-d74d-4798-9d50-82889bb1a22a&attribute=eval%2Fscore-df-by-cause-type - pod-cpu-hog AC@K 0.843750 - pod-memory-hog AC@K 0.22 - メモリ故障はやはり線形ではない?ので、精度が低い - 完全グラフのはずなのにケースが少ないのはなぜ? - メトリクス粒度よりコンテナ・サービス粒度のほうが精度が低いのは、コンテナ・サービス粒度では、コンテナ・サービスの重複を排除しているため。メトリクスについては、top-k内に複数の正解メトリクスがあれば、加点されるため、スコアが高くなる。 - ## FluxRank + Pearsonr + medoid + complete graph https://new-ui.neptune.ai/html-renderer/?experimentIdentifier=98db0140-58da-4fe3-bf39-957f56c3df80&attribute=eval%2Fscore-df-by-cause-type - SBDとほぼ同等の傾向 --- TrainTicket https://new-ui.neptune.ai/yuuk1/tsdr-localization/runs/table?viewId=98dc39c9-914e-44b9-8545-e12930bde368&detailsTab=metadata&shortId=TSDRLOC-173&dash=leaderboard&type=run&compare=IwdgzANMU9ew%2BTEuW1H1cz7feZA