## Memo
- [[NetManAIOps]]の論文。
- KPIは手動選択。
## Abstract
クラウドデータベースの市場が拡大する中、遅いクエリを注意深く検出し排除することは、サービスの安定性にとって非常に重要である。これまでの研究では、内部的な理由(例:SQLの書き方が悪いなど)に起因する遅いクエリの最適化に焦点が当てられてきました。この研究では、他の遅いクエリよりもデータベース利用者にとって危険な遅いクエリのセットを発見しました。このようなクエリは、通常、外部(例えば、データベースやマシンレベル)の断続的な性能問題に起因するため、間欠的スロークエリ(iSQs)と名付けました。iSQの根本原因を診断することは、困難ではありますが、非常に価値のあるタスクです。
本論文では、iSQUAD(Intermittent Slow QUery Anomaly Diagnoser)という、人間の介入を必要としない、iSQの根本原因を診断できるフレームワークを紹介します。この問題は複雑であるため、iSQと根本原因の相互関係を描くために機械学習アプローチが自然に明るみに出るが、汎用性、ラベリングのオーバーヘッド、解釈可能性の点で課題を抱えている。iSQUADは、オフラインのクラスタリングと説明段階、オンラインの根本原因診断と更新段階から構成されています。DBAは、オフラインの段階で各iSQクラスタに一度だけラベルを付ける必要があり、オンラインの段階で新しいタイプのiSQが出現することはありません。Alibaba OLTP Databaseの実データセットで評価した結果、iSQUADはiSQ根本原因診断の平均F1-スコア80.4%を達成し、精度と効率の面で既存の診断ツールを凌駕することが分かりました。
[[2020__VLDB__Diagnosing Root Causes of Intermittent Slow Queries in Cloud Databases__translations]]