# データベース自律診断 ## 定義 データベース自律診断は、スロークエリ、リソース枯渇、ハング、クラッシュ、演算子起因の性能異常などを自動的に分析し、根本原因と解決策候補を特定する取り組みである。[[データベース O&M]] の子 concept として、診断・RCA の責務を担う。([[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]]) ## 横断的知見 - **診断粒度は KPI → クエリ → 演算子へ細かくなっている**: OpDiag は演算子レベルの帰属を扱い、後続の修正作業量を減らす方向を示した。([[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]]) - **ドメイン知識の外在化が精度の律速である**: D-Bot は知識なしアブレーションで大幅に性能を落とし、DB 診断文書・ツール・LLM の組み合わせが必須であることを示した。([[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]]) - **木探索は早期停止と幻覚を抑える**: D-Bot の UCT 型探索や DBAIOps のグラフ推論は、LLM の単発診断を構造化し、誤ったツール呼び出しや早期停止を抑える。 - **DB 診断は一般 RCA と手法的に同型だが、証拠が DB 内部に寄る**: SOP/RAG/マルチエージェントという構造は [[根本原因分析]] と共通するが、実行計画・wait event・redo log・query operator が主証拠になる。 ## 未解決の問い - OpDiag の演算子レベル帰属を DBAIOps の ExperienceGraph に証拠として注入できるか。 - 複数 DBMS やクラウドマネージド DB に診断知識を移植するとき、どの知識が共通でどれが製品固有か。 - 診断後の解決策を自動実行する場合、DB 変更のリスクをどう評価・ロールバックするか。 ## 関連 - 親: [[データベース O&M]] - 隣接 concept: [[データベースノブチューニング]] / [[根本原因分析]] / [[AIOps]] / [[障害緩和]] - ソース: [[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]] / [[@2025__PVLDB__DBAIOps - A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs]] / [[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]] ## 出典 - [[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]] - [[@2025__PVLDB__DBAIOps - A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs]] - [[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]] - [[@2025__arXiv__A Survey of LLM × DATA]]