- 進捗
- 中間発表終了
- 研究課題2のジャーナル条件付き採録
- 研究課題4 IOTS2021へ投稿・採録
- [[Meltria]]
- 社会の背景
- マイクロサービス化へと変遷
- アプリケーションの管理負担が増大
- 統計学や機械学習にによる異常検知・原因分析を自動化する研究が活発である
- 評価用のデータセット
- 運用データを統計・機械学習で分析する際に、評価用のデータセットが必要となる
- 評価用データセットが独自に作成される
- 評価用のデータセットの用途
- 分野共通のベンチマーク
- 着想に至るまでの検証
- 静的 vs 動的
- ベンチマークとしては優れている
- 検証には向かない
- 提案
-
- 貢献
- 異常検知・原因分析の研究文献からデータセットの要件を導出
- 動的なデータセットの生成の設計基準の提案
- 検証アルゴリズムの評価結果、正確度 85%を達成
- 設計
- 故障注入のスケジューリングとデータ管理
- データセット検証
- 実装
- 評価
- 評価項目
- 第一設計基準:「入力となる条件に対応するデータセットが出力されたか?」
- 故障注入とデータ計測の条件の網羅な組み合わせに対する(FOUND_INSIDE_ANOMALYに手動で分類された系列数) / (全選択系列数)
- 第二設計基準:「自動で付与したラベルはどの程度正確か?」
- 手動によるラベル付けを正解としたときの正確度(Accuracy)
- 実験の設定
- Sock Shopを構成する8種類のコンテナに対して,CPU過負荷とメモリリークの故障を、5回ずつ注入した(計90回の故障注入)
- データ取得の間隔は 15 秒
- スロットの時間範囲を 30 分
- 第一の設計基準の評価
- 第二の設計基準の評価
- 考察
- 研究の限界
- 対象アプリケーションは固定にならざるをえない
- まとめ
- マイクロサービスの異常検知・原因分析の手法を効率よく検証するために、動的にデータセットを生成するシステムMeltriaを提案
- 故障注入のスケジューリ ング,故障とデータの対応管理
- 統計学の経験則によるデータセットのラベル付けの自動化
- 分類手法の正確度は85%
- 誤分類の要因は,変動が小さいケース
- IOTS2021査読コメント
- 静的と動的の対比を明確に
- 生成したデータセットの有効性の比較
静的 vs 動的の対比がよいのか。
単に手作業を自動化したという話に帰着する?
研究目的:マイクロサービスの異常検知・原因分析のデータ分析手法の検証を効率化するために、注入する故障条件とデータ計測条件を可変とすることにより、動的にデータセットを生成するシステムの実現
## TODO
- [ ] 中間発表質疑
- [x] 動機と課題を整理する
- [x] 静的と動的の性質の差を絵で描く
- [x] Meltriaの実装を絵で描く
- [x] 実験環境とその内容
- [x] 第一設計基準の評価
- [x] まとめ
- [x] 今後の展望