2022年1月12日 10:30~ ## スライド ![[okabelab_meeting_202201.pdf]] ## アウトライン - 進捗サマリ - その他: ブログ [[Linux eBPFトレーシング技術の概論と実装]] - サマリ:研究課題3 時系列解析の研究 [[research/tsifter/TSifter]] - 昨年11月研究会での報告 - 手動でつくる正解データを改善。異常の伝搬経路上のノードの集合で正解を表現するようにした。 [[TSifter 経路上のノードが存在するかで評価]] - 提案モデルのステップ1の誤判定を改善。 - 今日までの過程 1. データセット全体に対して、定量的に評価したところ、正確性が68%しかなかった。(次元削減率 86%) 2. モデルを改良し、各スコアを改善 - ステップ1の誤判定をさらに改善 => 正確性 89% - 次元削減率も改善 => 93% - 研究概要を述べる - 洞察1:期間中の変化が小さいもの。傾向に変化がないもの。 - ホワイトノイズ => 定常性をもつ系列(単位根検定) ![[Pasted image 20220110182515.png|400]] ![[Pasted image 20220110182801.png|400]] 周期性 ![[Pasted image 20220110182812.png|400]] - 単調増加・減少 => 階差系列に対する変動係数 - 絶対値に対する変化が小さいケース => 原系列に対する変動係数 - 洞察2:同一コンポーネント内で、時系列グラフの形状が似ているものは冗長である。 - ネットワーク系メトリックなど - ステップ1のおさらい - 仮定:インシデント発生前後の変化が小さい系列は必要ない - - 評価結果 - 実験設定 - [[Sock Shop]] - CPU故障とメモリ故障 - 実験結果のまとめ - スコアシート - ![[Pasted image 20220111125411.png|200]] ![[Pasted image 20220111125737.png|300]] - ステップ2の改善点 - グラフの形状をみすぎている - 移動平均線のようなトレンドラインに対して、クラスタリングする - ネットワーク故障のデータで、正確性が低い - ネットワーク系メトリックの系列の変動が小さいケース - もともとの流量が小さいケース - 今後の予定 - 現在のデータセットで正確性が100%となるように工夫を重ねる - データセット規模を増加させる - 現在の小規模アプリで、各コンポーネントの複製を増やす - 中規模アプリ(Train Ticket)でデータ取得 - 現実的なシナリオに沿った障害パターンを追加する - 外部アクセスを徐々に増加させ、ボトルネックを発生させる - 障害対応者視点での時系列の変動パターンを体系化 - 他分野での時系列データの次元削減手法の調査と比較