# データベース自律診断
## 定義
データベース自律診断は、スロークエリ、リソース枯渇、ハング、クラッシュ、演算子起因の性能異常などを自動的に分析し、根本原因と解決策候補を特定する取り組みである。[[データベース O&M]] の子 concept として、診断・RCA の責務を担う。([[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]])
## 横断的知見
- **診断粒度は KPI → クエリ → 演算子へ細かくなっている**: OpDiag は演算子レベルの帰属を扱い、後続の修正作業量を減らす方向を示した。([[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]])
- **ドメイン知識の外在化が精度の律速である**: D-Bot は知識なしアブレーションで大幅に性能を落とし、DB 診断文書・ツール・LLM の組み合わせが必須であることを示した。([[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]])
- **木探索は早期停止と幻覚を抑える**: D-Bot の UCT 型探索や DBAIOps のグラフ推論は、LLM の単発診断を構造化し、誤ったツール呼び出しや早期停止を抑える。
- **DB 診断は一般 RCA と手法的に同型だが、証拠が DB 内部に寄る**: SOP/RAG/マルチエージェントという構造は [[根本原因分析]] と共通するが、実行計画・wait event・redo log・query operator が主証拠になる。
## 未解決の問い
- OpDiag の演算子レベル帰属を DBAIOps の ExperienceGraph に証拠として注入できるか。
- 複数 DBMS やクラウドマネージド DB に診断知識を移植するとき、どの知識が共通でどれが製品固有か。
- 診断後の解決策を自動実行する場合、DB 変更のリスクをどう評価・ロールバックするか。
## 関連
- 親: [[データベース O&M]]
- 隣接 concept: [[データベースノブチューニング]] / [[根本原因分析]] / [[AIOps]] / [[障害緩和]]
- ソース: [[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]] / [[@2025__PVLDB__DBAIOps - A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs]] / [[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]]
## 出典
- [[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]]
- [[@2025__PVLDB__DBAIOps - A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs]]
- [[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]]
- [[@2025__arXiv__A Survey of LLM × DATA]]