2018__SIGMOD__The Case for Learned Index Structures

## Memo - 初出はarXivで2017年に公開された - [[Jeffrey Dean]]が著者リストにいる ## Abstract **Inddexs are models**. B-Tree-Indexはソートされた配列内のレコードの位置にキーを対応付けるモデル、Hash-Indexはソートされていない配列内のレコードの位置にキーを対応付けるモデル、BitMap-Indexはデータレコードが存在するかどうかを示すモデルとして見ることができる。この探索的研究論文では、この前提から出発して、既存のすべてのインデックス構造を、深層学習モデルを含む他のタイプのモデルで置き換えることができると仮定する。そのキーとなる考え方は、あるモデルがルックアップキーのソート順や構造を学習し、この信号を用いてレコードの位置や存在を効果的に予測できることである。我々は、学習型インデックスがどのような条件下で従来のインデックス構造より優れているかを理論的に分析し、学習型インデックス構造を設計する際の主な課題を説明する。我々の最初の結果は、ニューラルネットを用いることで、キャッシュに最適化されたB-Treeを最大70%の速度で上回り、同時に実世界のデータセットで1桁のメモリ使用量を削減できることを示しています。しかし、より重要なのは、データ管理システムのコアコンポーネントを学習済みモデルで置き換えるというアイデアは、将来のシステム設計に大きな影響を与えることであり、この研究はその可能性の一端を示すものに過ぎないと考えています。 [[2018__SIGMOD__The Case for Learned Index Structures__translations]]