研究室内研究会202110アウトライン

- 進捗 - 中間発表終了 - 研究課題2のジャーナル条件付き採録 - 研究課題4 IOTS2021へ投稿・採録 - [[Meltria]] - 社会の背景 - マイクロサービス化へと変遷 - アプリケーションの管理負担が増大 - 統計学や機械学習にによる異常検知・原因分析を自動化する研究が活発である - 評価用のデータセット - 運用データを統計・機械学習で分析する際に、評価用のデータセットが必要となる - 評価用データセットが独自に作成される - 評価用のデータセットの用途 - 分野共通のベンチマーク - 着想に至るまでの検証 - 静的 vs 動的 - ベンチマークとしては優れている - 検証には向かない - 提案 - - 貢献 - 異常検知・原因分析の研究文献からデータセットの要件を導出 - 動的なデータセットの生成の設計基準の提案 - 検証アルゴリズムの評価結果、正確度 85%を達成 - 設計 - 故障注入のスケジューリングとデータ管理 - データセット検証 - 実装 - 評価 - 評価項目 - 第一設計基準：「入力となる条件に対応するデータセットが出力されたか？」 - 故障注入とデータ計測の条件の網羅な組み合わせに対する(FOUND_INSIDE_ANOMALYに手動で分類された系列数) / (全選択系列数) - 第二設計基準：「自動で付与したラベルはどの程度正確か？」 - 手動によるラベル付けを正解としたときの正確度（Accuracy） - 実験の設定 - Sock Shopを構成する8種類のコンテナに対して，CPU過負荷とメモリリークの故障を、5回ずつ注入した（計90回の故障注入） - データ取得の間隔は 15 秒 - スロットの時間範囲を 30 分 - 第一の設計基準の評価 - 第二の設計基準の評価 - 考察 - 研究の限界 - 対象アプリケーションは固定にならざるをえない - まとめ - マイクロサービスの異常検知・原因分析の手法を効率よく検証するために、動的にデータセットを生成するシステムMeltriaを提案 - 故障注入のスケジューリング，故障とデータの対応管理 - 統計学の経験則によるデータセットのラベル付けの自動化 - 分類手法の正確度は85% - 誤分類の要因は，変動が小さいケース - IOTS2021査読コメント - 静的と動的の対比を明確に - 生成したデータセットの有効性の比較静的 vs 動的の対比がよいのか。単に手作業を自動化したという話に帰着する？研究目的：マイクロサービスの異常検知・原因分析のデータ分析手法の検証を効率化するために、注入する故障条件とデータ計測条件を可変とすることにより、動的にデータセットを生成するシステムの実現 ## TODO - [ ] 中間発表質疑 - [x] 動機と課題を整理する - [x] 静的と動的の性質の差を絵で描く - [x] Meltriaの実装を絵で描く - [x] 実験環境とその内容 - [x] 第一設計基準の評価 - [x] まとめ - [x] 今後の展望