### 実験 - [x] 正確性の経路評価 - [[TSifter実験 GroundTruth 20211214]] - [x] orders経由じゃなくてもよいように正解を修正 - [fix ground truth by yuuki · Pull Request #8 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/8) - 1系列でもマッチしてたらokになってしまっている - fixed [lib/metrics: fix a bug where the check was passed through if it match… · ai4sre/meltria-analyzer@a0e8aec · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/a0e8aec092eab6c1afc55a9ec95630ff58f520fb) - front-end がなぜかマッチしたメトリックが0になっている。 - fixed [lib/metrics: fix a bug where the check is always rejected if the caus… · ai4sre/meltria-analyzer@e79d8a7 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/e79d8a7fabc64bf1ab2cb70d42c9624c386ad564) - [[TSifter実験 20220106]] - [ ] 削減率の改善 - [x] step2 でぜんぜん削減できていない原因を探る - [x] クラスタリングでなにがまとめられたかをneptuneに記録 - [tools: log clustering_info into neptune · ai4sre/meltria-analyzer@8327759 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/83277590f4cd9ba4d075e7c39d8b91d8f172a333 - [x] クラスタリングの時系列グラフを作成し、neptuneに記録 - [tools: log figures for clustering time seires graph in eval_tsdr · ai4sre/meltria-analyzer@2ce0818 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/2ce081887c70f1d30d99937b02154b9a8b760a57) - [x] 系列数の変化もneptuneに記録 - [tools: log the number of series in tests, too · ai4sre/meltria-analyzer@49c976c · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/49c976c33f3e6b2f604903b2f97157ca4658d2f8) - [[TSifter実験 20220107]] - [x] non-clusterメトリックのグラフをneptuneに記録する - [tools: log non-clustered time series figures · ai4sre/meltria-analyzer@0a09bda · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/0a09bdad6acf372f2bb16def0196cc09ae26a44b) - [x] non-clusterメトリックの一覧をneptuneに記録する - [tools: log non-clustred metrics as table · ai4sre/meltria-analyzer@47c44f8 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/47c44f8d532d1f5863eec7f8835ef5d50129c9d5) - [x] neptune画像アップロードをマルチプロセス並列化 - [tools: enable clustred plotting multi-processed · ai4sre/meltria-analyzer@de15e5b · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/de15e5bc4a87d1706c6c5a9948509690834bfded) - [x] clustred metricsの画像がアップロードされなくなった問題を修正 - 1minぐらいしか差が出なかった - [x] ミドルウェアメトリックを排除して計測する - [x] ミドルウェアメトリックを除外するフラグ追加 - [tools: add exlcude-middleware-metrics options · ai4sre/meltria-analyzer@f427d53 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/f427d535569b1bc98556f027d54fa31cdd71ab05) - [x] トレンド傾向の[[定常性]]をもつメトリックを削減対象とする - [tools: add step1_regression option · ai4sre/meltria-analyzer@ea2f4a3 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/ea2f4a3244fb4103105c3d275e7176734b39eec6) - regressionに'ct'を指定しても特に削減されていない。 - [x] Jupyterで詳細に解析する。 - [x] 階差をとってから[[拡張Dickey-Fuller検定|ADF検定]]にかける - すべて定常過程と判定されてしまった。 - [x] [[KPSS検定]]を試す - うまくいかない - [x] 自己相関検定 ljungbox 検定 - p値が常に0付近になる - [x] [[トレンド検定]]を試す - yue_wang_modification_testならいける - [x] [[変化点検出]]を試す - うまくいかない 実行時間が長い - [x] 変動係数値で閾値判定 - container_last_seenについては除去できた - [tsdr: use coefficient variance for original and differential series · ai4sre/meltria-analyzer@5ec7aea · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/5ec7aea7f3eddce360cc386e698364a62bc9fd86) - 最大最小の差分値が、最大値に対しても最小値に対しても絶対的に小さい系列 - 原系列に[[変動係数]]をかけるだけで成功 - [[TSifter実験 時系列異常検知 20220110]] - [ ] ordersとcartsのpod-memory-hog欠損対応 - [[拡張Dickey-Fuller検定|ADF検定]]なしで試すと、次のようなホワイトノイズを除去できない - ![[Pasted image 20220110182515.png]] - [x] step1 ADF検定の誤判定を修正する - [[Phillipps-Perron検定]]を試す - [7 Statistical Tests to validate and help to fit ARIMA model | by Pratik Gandhi | Towards Data Science](https://towardsdatascience.com/7-statistical-tests-to-validate-and-help-to-fit-arima-model-33c5853e2e93) に記載されている - 小ケースではよい結果 - [tsdr: use pp test instead of adf test in trial · ai4sre/meltria-analyzer@c3f91bc · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/c3f91bcb6eb76fe5e949035b6bb1ae60fbf0cb6e) - データセットに試したら、途中でブロックするようになった。 - https://app.neptune.ai/yuuk1/tsifter/e/TSIF-135/monitoring - `Running tsdr 2021-12-09-argowf-chaos-hg68n-orders_pod-cpu-hog_4.json of orders/pod-cpu-hog ...` で停止 - [x] この無限ブロックを修正する。 - pp検定ライブラリをかえて、例外キャッチするように - [x] 変動係数による除去をなしでやってみる - shippingに対して、次元削減率低下 - [x] 差分系列のみの変動係数除去で試す - 次元削減率は低下 むしろ差分系列の変動係数やんなくてよい? - 以前のADF検定でmax_lags=1にしないとだめだった系列で、lags指定なしでうまくいった。 - [x] pmdarimaパッケージから例外がでるのを修正 - [x] pp検定はarchパッケージにもあったので、arch.unitrootを使うようにする。 [tsdr: use arch.unitroot instead of pmdarima · ai4sre/meltria-analyzer@eef85be · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/eef85be20894e49932adb5ed2308dcccbab11dc9) - [Improve accuracy of step1 by yuuki · Pull Request #11 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/11) - [[TSifter実験 時系列異常検知 20220111]] - [x] TSifter用の正確性テストコードを書く - [test tsdr stationality by yuuki · Pull Request #12 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/12) - [x] 短時間スパイク時系列に対して、[[Phillipps-Perron検定]]では定常と判定されたのを修正する。 - [x] オフラインの[[変化点検出]]を試す。 - 変化点が0と1の区別が難しい。パラメータに敏感。 - [x] [[k-最近傍法|k-NN]]による異常検知を試す。 - [knn-based outlier detector by yuuki · Pull Request #13 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/13) - [x] kNNパラメータを引数指定可能とする - knnはホワイトノイズも異常判定してしまう。 - pp検定のトレンドをct -> cにするとスコアがよくなった - [x] knnの異常度列に対して、単位根検定をかけてみる。 - 削減率がいまひとつ - knnのwindowサイズに性能が依存する。w=2,3,4あたりは正確性にかけるが、削減率はあがる。w=5で正確性100%になる - [x] banpeiによる [[特異スペクトル変換法]]を試す - エラーになってよくわからない - [x] 様々なパラメータの組み合わせチェック - ADF, alpha-0.01, 対数変換あり、cv_threshold=0.5、 - logの真数が0になってエラー - log1pだとショートスパイクでこける - [[Z-score]] + knnを試す。 - [[TSifter実験 時系列異常検知 20220127]] - [x] [[ホテリングのT2法]]を試す。 - [x] notebookでチェック - 短時間スパイクとホワイトノイズの区別はできていそう。 - [[TSifter実験 時系列異常検知 20220129]] - [hotteling t2 by yuuki · Pull Request #19 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/19) - 自己相関検定により、ホワイトノイズとそれ以外を区別する。 - [x] [[ARモデルの予測誤差による外れ値検知]]を試す。[[単位根検定]]の代わり。 - [Autoregressive model based anomaly detection by yuuki · Pull Request #20 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/20) - [[TSifter実験 20220131]] - [x] ARモデルの異常度にカイ二乗分布の当てはめによりp値で閾値設定 - [fitting chi2 dist ar based ad by yuuki · Pull Request #23 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/23) - [[TSifter実験 時系列異常検知 20220203]] - [x] knnとarの外れ値検出のテストを書く - [x] トレンドラインを引いて単位根検定にかける検討。 - トレンドラインにより特徴がきえてしまうような気がする。 - [x] memory-hogをいれたときにmemory_working_set_bytesなどのメモリ系のメトリックが除外されていることがある原因を調査する。 [[TSifter実験 時系列クラスタリング 20220204]] - [x] 可視化して確認 - [x] ラグ次数を変化させる - [ ] ラグ次数指定したときのテスト - [x] ラグ次数=1でなぜ急激な変化にフィットできているのかを調査する - [[ARモデルの動的予測]] - ARモデルのdynamic predictionを有効にして評価したところ次元削減率が70%台まで低下した。 - [[TSifter実験 時系列異常検知 20220211]] - 低下するのは当たり前 - 予測誤差の計算のオフセットがずれていた - ステップ2の削減率を改善する - [[TSifter実験 時系列異常検知 20220201]] [[TSifter実験 時系列異常検知 20220203]] - [x] ARモデルベースの手法で、ホワイトノイズと周期的スパイクの除去 - [x] ホテリングのT2法を試す - 1-3件だけうまくいかなかったりする - [x] クラスタリングの事前知識でサービスメトリックとコンテナメトリックを分離する - [improve clustering target by yuuki · Pull Request #24 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/24) - [x] 距離の閾値を変更して、チューニング。 - [[TSifter実験 時系列クラスタリング 20220204]] - [x] 異常度系列に対してクラスタリングする - [anomaly score based clustering by yuuki · Pull Request #25 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/25) - [x] ステップ1で動的予測を有効にするとエラーになるので修正 - 動的予測せずとも精度がよくなったので、いらない。 - [x] 異常度系列で積分の最大値をとる系列を代表メトリックとして選択 - [x] Ground Truth定義の修正 - [x] pod-memory-hog - [GitHub - ai4sre/meltria-analyzer at extend_ground_truth_definition](https://github.com/ai4sre/meltria-analyzer/tree/extend_ground_truth_definition) - [x] 距離の閾値を大きくする - [[TSifter実験 GroundTruth 20220214]] - [x] 異常度時系列をバイナリ列のシーケンスに変換 - [binary-based anomaly score by yuuki · Pull Request #28 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/28) - [x] 異常度系列のバイナリシーケンスに [[ハミング距離]]を試す - [[TSifter実験 時系列クラスタリング 20220218]] - [[TSifter実験 時系列クラスタリング 20220219]] - [x] 異常度系列のバイナリシーケンスにSBD+no zscoreをあてる - [[TSifter実験 時系列クラスタリング 20220219-02]] - [x] なぜかクラスタにまとまらない系列の調査 - [x] クラスタの更新方法を評価スクリプトから指定可能とする - [x] [[ウォード法]]を試す [[TSifter実験 時系列クラスタリング 20220220]] - [x] クラスタがサービスとコンテナで分離できていない問題の修正 - [make it possible to choose one of clustering linkage methods by yuuki · Pull Request #31 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/31) - [x] 代表系列を異常度系列のmaxsumで選ぶ実験 - [x] 次元削減率の理想値を求める - [x] ミドルウェアメトリックを収集できていない問題を解決 - [manifests: increase volume size for prometheus · ai4sre/meltria@612f5f2 · GitHub](https://github.com/ai4sre/meltria/commit/612f5f2a6a4f005df06efdeb65262a2e2a1b2324) - [ ] ミドルウェアメトリックをいれるかいれないかで削減率の変化を記録する - [x] tsdrパッケージのパラメータ引き回しをdictでまとめる - [x] Meltriaでサービスのエラーメトリックも収集する - [ ] reduction rateの算出を正解したものだけにする? - accuracy 100%前提ならいらない - [ ] 正確性定義の拡張 - [ ] ステップ1で memory-hogのときに、ちゃんとmemory_working_set_bytesが残っているかをチェック - [ ] ステップ1とステップ2の正解定義の分離 - [ ] 実行時間の評価 - [x] Neptuneに記録する - [save elapsed time into neptune by yuuki · Pull Request #21 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/21) - [ ] FaaSによるスケーリングの評価 - [ ] 因果グラフ構築の実装 - [x] [[PCアルゴリズム]]ベースのグラフ構築 - [x] グラフ探索アルゴリズムの実装 - [x] 原因診断処理の評価実験をNeptuneで追跡 - [x] 因果グラフの方向づけを改善 - [x] サービスメトリックとコンテナメトリックの階層構造 - [x] ネットワーク通信の依存方向 - [improve orientation of causal graph by yuuki · Pull Request #33 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/33) - [[TSifter実験 因果グラフ構築 20220303]] - [x] 事前知識による削除辺の構築のリファクタリング - [Refactor building no edge path for init graph by yuuki · Pull Request #36 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/36) - [x] 因果グラフレベルの評価 - [x] 経路ベースの正解定義と比較し、正確性を算出 - [Evaludate accuracy of causal graph by yuuki · Pull Request #34 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/34) - [[TSifter実験 因果グラフ構築 20220309]] - [Fix direction of causal graph 2 by yuuki · Pull Request #35 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/35) - [[TSifter実験 因果グラフ構築 20220309-02]] - [x] 同一コンテナ内のコンテナメトリック間のエッジはすべて双方向にする - [Fix edge direction in the same component by yuuki · Pull Request #37 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/37) - [x] densityのstatを記録 - [x] [[Flow Hierarchy]] - [x] 複数ルートノードのサポート - [Support multiple root nodes of building and checking causal graphs by yuuki · Pull Request #38 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/38) - [[TSifter実験 因果グラフ構築 20220310]] - [x] 同一サービス内の方向づけ修正 - [Fix edge direction in the same service by yuuki · Pull Request #39 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/39) - [[TSifter実験 因果グラフ構築 20220310-02]] - [x] [[PCアルゴリズムのCIエッジ誤削除調査]] - [x] meltria-analyzerのディレクトリ構造の整理 - [Improve directory layout by yuuki · Pull Request #40 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/40) - [x] 因果グラフ構築コードのリファクタリング:networkxのノードをカスタムオブジェクトにする - [netrokx graph node as custom python class by yuuki · Pull Request #41 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/41) - [x] 因果グラフの可視性をあげる - [x] メトリクスの種別ごとにノードの形状をかえる - [x] HTML + JSでグラフ表示 [pandas→networkx→pyvisでネットワーク分析&可視化 - Qiita](https://qiita.com/niship2/items/9d7e2b6ab2ca1be18eaf) - [Improve visibility of causality graph by yuuki · Pull Request #42 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/42) - [x] 因果グラフと時系列グラフを同時に表示する - [Replace the visualization tool with Holoviews by yuuki · Pull Request #44 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/44) - [x] 因果グラフを別々に描画させる - [x] レンダリングの高速化のためにグラフをマージする - [eval: merge small graphs to speed up the rendering process · ai4sre/meltria-analyzer@75cf5a8 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/75cf5a83c25d684aa7cd5d7353cd4d550da8d69f) - [ ] PCアルゴリズムグラフ構築の並列化 - pgmpyのparallel ? - [ ] 因果グラフの正確性の改善。原因メトリックで必ず含まれてほしいメトリックの指定。 memory_working_set_bytesなど。 - [ ] 時間差を考慮した因果グラフの構築 [[2020__IWQoS__Localizing Failure Root Causes in a Microservice through Causality Inference|MicroCause]] - [TIGRAMITE — Tigramite 5.0 documentation](https://jakobrunge.github.io/tigramite/) - [x] お試し [Trying out tigramite by yuuki · Pull Request #46 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/46) - [x] TSDR step1の変化点を可視化 - [Visualize anomaly points on time series graphs by yuuki · Pull Request #47 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/47) - [[TSifter実験 時系列異常検知 20220328]] - [x] AR異常検知の変化点位置の改善 - [x] 平滑化を試す [[時系列データの平滑化]] - [x] 移動平均を試す [[Pythonによる移動平均]] - [x] [[tsmoothie]]を試す [[TSifter実験 時系列異常検知 20220330]] - [x] ホテリングT2法のみを試す - [x] 構造変化を試す [notebooks: try out jenkspy · ai4sre/meltria-analyzer@26f2102 · GitHub](https://github.com/ai4sre/meltria-analyzer/commit/26f2102fd0a9a6e344a01cb32ee8f1006be2a85a) - [x] 構造変化クラスタリング + AR予測誤差 - [ ] ホテリングT2の正常時学習モデル - [x] ARモデルのサンプル内予測 + ARの正常時学習モデル + 異常スコアピーク値降下法 - [x] PatternMatcherのKS検定を試す - [ ] 無向グラフ + [[PageRank]]ベースのグラフ構築 [[2020__IPCCC__FluxInfer―Automatic Diagnosis of Performance Anomaly for Online Database System|FluxInfer]] (Optional) - [ ] 既存の前処理法と比較 - [x] [[K-S検定]]との比較 [[2021__ISSRE__Identifying Root-Cause Metrics for Incident Diagnosis in Online Service Systems|PatternMatcher]] - [x] [[2020__IPCCC__FluxInfer―Automatic Diagnosis of Performance Anomaly for Online Database System|FluxInfer]]の混合ガウス分布平滑化と比較。 - [x] [[2019__ISSRE__FluxRank―A Widely-Deployable Framework to Automatically Localizing Root Cause Machines for Software Service Failure Mitigation|FluxRank]]のDBSCANクラスタリング - [x] [[2019__ISSRE__FluxRank―A Widely-Deployable Framework to Automatically Localizing Root Cause Machines for Software Service Failure Mitigation|FluxRank]]の絶対微分 - [ ] [[2014__INFOCOM__CauseInfer―Automatic and distributed performance diagnosis with hierarchical causality graph in large distributed systems|CauseInfer]]のBCP - [x] ステップ1他手法試す - [x] 3-sigma method + zscore - [x] chowtest - [x] 統計的検定による変化点検知 - [x] KPSS test - [x] ヒストグラムベース外れ値検知 - [x] [[単回帰トレンド定常モデルの残差和に基づく異常検知法]] - [x] Jenkspy試す - [x] ステップ1の前の事前除去 すべて同じ値 すべてNaN - [x] 変化開始点 - [x] tsdrに実装 - [x] neptuneで変化開始点可視化 - [x] 変化開始点をもとにした系列除去 - [x] SLOメトリックの障害検知 -> 3 sigma - [x] ステップ追加に頑強なコード - [x] accuracy定義の修正 経路のOR条件 - [ ] 故障注入なしのデータセットと比較 - [ ] 削減率が高くなるはず - [ ] [[TSifterの時系列クラスタリングをHDBSCANへ]] - [ ] データセットの拡充 - [x] JVMメトリクスの取得 - [ ] Sock Shop + 1podあたり複数レプリカ - [ ] レプリカの区別の改修 - [x] Sock Shop + (ノードメトリック) + ミドルウェアメトリック - [[TSifter実験 ミドルウェアメトリクス 20220429]] - [ ] 故障の時間範囲の変化 - [ ] 故障ケースの追加 - [ ] 負荷を徐々に増やす - [ ] max connections (Optional) - [ ] 複数Podへの同時injection (optional) - [ ] Pod数を100倍へ (optional) - [ ] k8sのNoisy Neighbor問題 cgroupリミットのかけわすれ - [ ] 特定アイテムの偏りによる負荷増大 - [x] Sock Shop以外のアプリケーションでの実験 [[TrainTicket]] - [x] TrainTicket構築[Introduce train-ticket by yuuki · Pull Request #6 · ai4sre/meltria · GitHub](https://github.com/ai4sre/meltria/pull/6) - [x] middleware metrics - [x] JVM - [x] Mongo - [x] nginx - [x] レスポンスタイムをとれるように - [ ] MySQL - [ ] Kubernetes - [x] Prometheus annonation scrape - [x] Prometheusからデータ採取スクリプト修正 - [x] algo litmus セットアップ - [x] 実験データ採取 - [ ] ステップ1 [[SPOT]]との比較 - [ ] 各パラメータを可変させたときの正確性と次元削減率の変化 - [ ] ステップ1の有意水準 - [ ] クラスタリングの距離の閾値 - [ ] 系列長の変化が正確性や次元削減率にどれだけ影響をもたらすか - [ ] 2段階のステップの各段階のみをベースラインとした評価 - [ ] 実験効率化 - [x] ハイパラ管理を[[Hydra]]へ - [introduce hydra by yuuki · Pull Request #15 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/15) - [x] ハイパラをkwargsで引き回し - [tsdr: pass parameters with \*\*kwargs by yuuki · Pull Request #16 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/16) - [ ] datasetとfiguresをproject metadataへ - [x] meltria-analyzerのPython 3.10バージョンアップ - 失敗 2022/01/22 - [x] モデルを評価スクリプトから選択できるように - [enable to select tsdr model by yuuki · Pull Request #17 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/17) - [x] eval_tsdrにdebug指定の場合、画像生成をさせないようにする - [x] 正確性のテストコードを書く - [x] 典型的なメトリックをコピーしてfixturesへ - [x] Notebookからも参照できるようにする。 - [x] testsパッケージからtsdrパッケージへ移行する - [move test tsdr univariate by yuuki · Pull Request #22 · ai4sre/meltria-analyzer · GitHub](https://github.com/ai4sre/meltria-analyzer/pull/22) - [x] neptuneにアップロードする画像サイズを動的調整する - [x] dataset/ 以下の画像サイズが動的調整されていなかったので要修正 - [ ] ステップ1の実行結果を保存しておき、同じデータセットかつ同じステップ1パラメータであれば、保存結果を再利用してステップ2のみ実行する - [ ] コストカットのため、実験中以外はノードをとめる - [開発環境のリソース無駄使いを防止しました!|Daisuke Taniwaki|note](https://note.com/dtaniwaki/n/n90a09161ea36) - [x] diagnoserの因果グラフ画像にタイトルをいれる - [x] tsdrの時系列グラフもmatplotlibからHoloviewsへ - [ ] promtool dump tsdbを使う https://github.com/ihcsim/promdump ## 論文執筆 [[TSifter 2022 paper - draft]] - [ ] タイトルの決定 - Fast Dimensionality Reduction of Time Series for Localizing Root Causes in Cloud Applications. - A Framework of Fast Preprocessing Time Series for Localizing Root Causes in Cloud Applications. - [ ] 全メトリック系列を解析しないといけない理由の明確化 - [ ] MSAに依存しない環境があることを明示 - [ ] コンポーネントごとにメトリックを選択しなければならない課題 - [ ] コンポーネントの各メトリックの次元を揃えなければならない課題 - [ ] 正確性の経路評価 - [ ] インシデント対応時2つの洞察の事例を示す - [ ] 1. 変動が小さい系列からは情報を読み取れない - [ ] 2. 形状が似ている系列は冗長 - 考察 - 分散アプリケーションの時系列データの特徴の分析 - [ ] TSifterで最終的に残った時系列データの特徴分類