2022年1月12日 10:30~
## スライド
![[okabelab_meeting_202201.pdf]]
## アウトライン
- 進捗サマリ
- その他: ブログ [[Linux eBPFトレーシング技術の概論と実装]]
- サマリ:研究課題3 時系列解析の研究 [[research/tsifter/TSifter]]
- 昨年11月研究会での報告
- 手動でつくる正解データを改善。異常の伝搬経路上のノードの集合で正解を表現するようにした。 [[TSifter 経路上のノードが存在するかで評価]]
- 提案モデルのステップ1の誤判定を改善。
- 今日までの過程
1. データセット全体に対して、定量的に評価したところ、正確性が68%しかなかった。(次元削減率 86%)
2. モデルを改良し、各スコアを改善
- ステップ1の誤判定をさらに改善 => 正確性 89%
- 次元削減率も改善 => 93%
- 研究概要を述べる
- 洞察1:期間中の変化が小さいもの。傾向に変化がないもの。
- ホワイトノイズ => 定常性をもつ系列(単位根検定)
![[Pasted image 20220110182515.png|400]]
![[Pasted image 20220110182801.png|400]]
周期性 ![[Pasted image 20220110182812.png|400]]
- 単調増加・減少 => 階差系列に対する変動係数
- 絶対値に対する変化が小さいケース => 原系列に対する変動係数
- 洞察2:同一コンポーネント内で、時系列グラフの形状が似ているものは冗長である。
- ネットワーク系メトリックなど
- ステップ1のおさらい
- 仮定:インシデント発生前後の変化が小さい系列は必要ない
-
- 評価結果
- 実験設定
- [[Sock Shop]]
- CPU故障とメモリ故障
- 実験結果のまとめ
- スコアシート
- ![[Pasted image 20220111125411.png|200]] ![[Pasted image 20220111125737.png|300]]
- ステップ2の改善点
- グラフの形状をみすぎている
- 移動平均線のようなトレンドラインに対して、クラスタリングする
- ネットワーク故障のデータで、正確性が低い
- ネットワーク系メトリックの系列の変動が小さいケース
- もともとの流量が小さいケース
- 今後の予定
- 現在のデータセットで正確性が100%となるように工夫を重ねる
- データセット規模を増加させる
- 現在の小規模アプリで、各コンポーネントの複製を増やす
- 中規模アプリ(Train Ticket)でデータ取得
- 現実的なシナリオに沿った障害パターンを追加する
- 外部アクセスを徐々に増加させ、ボトルネックを発生させる
- 障害対応者視点での時系列の変動パターンを体系化
- 他分野での時系列データの次元削減手法の調査と比較