## Memo ## Abstract データ管理問題を最適化するための機械学習(ML)技術は、最近5年間で広く研究され、広く導入されている。しかし、従来のML手法は、汎化性(異なるシナリオへの適応)と推論能力(文脈の理解)に限界がある。幸い、大規模言語モデル([[notes/data-science/LLM]])は高い汎化性と文脈理解における人間的競争力を示しており、データ管理タスク(データベース診断、データベースチューニングなど)に有望である。しかし、既存のLLMには、幻覚、高コスト、複雑なタスクに対する精度の低さなど、いくつかの限界がある。これらの課題に対処するために、我々はLLMDBを設計する。LLMDBは、幻覚を回避し、LLMのコストを削減し、高い精度を達成しながら、汎化性と高い推論能力を持つLLM拡張データ管理パラダイムである。LLMDBは、LLMの[[ファインチューニング]]とプロンプトエンジニアリングにより、幻覚を回避するためにドメイン固有の知識を埋め込む。LLMDBは、意味的検索とキャッシュ能力を提供するベクトルデータベースにより、LLMの高コストを削減する。LLMDBは、多ラウンド推論とパイプライン実行を提供するLLMエージェントにより、タスク精度を向上させる。我々は、LLMDBがうまくサポートできる3つの実世界シナリオを紹介する。また、LLMDBの未解決の研究課題についてもまとめる。