## Memo
## Abstract
オンライントランザクション処理(OLTP)システムのパフォーマンスには、異常診断が不可欠である。一方、機械学習技術は、人間の能力を超えた複雑な関係を推論することができ、このような問題で高い性能を発揮する。しかし、それらは異常のための大量の学習サンプルに依存しており、収集の難しさから産学ともに深刻な不足に陥っている。この問題は、異常の再現とデータ収集のためのベンチマークの需要を高めている。
本論文では、トランザクションデータベースの性能異常のためのベンチマークであるDBPAを提案する。具体的には、多様な影響要因に根ざした9つの共通した異常を特定する。それぞれの異常について、実世界のデータベースにおける根本原因からなる再現手順を慎重に設計する。この再現手順により、ユーザーは新しい環境でデータセットを作成し、新しいアノマリータイプを拡張することが容易になります。複合アノマリーについては、既存の収集データとのあらゆる組み合わせの複合アノマリーデータを生成することができる生成アルゴリズムを提供します。また、様々な環境から収集した正常な監視データと異常な監視データの大規模なデータセットを提供し、機械学習モデルの学習や、異常診断のための新しいアルゴリズムの評価を容易にすることができます。