# 列指向OLAPデータベース
## 定義
列指向 OLAP(Online Analytical Processing)データベースは、データを行単位でなくカラム(列)単位に格納・処理するデータベースシステムであり、大規模なテーブルの集計・フィルタリング・スキャンが中心となる分析ワークロードに最適化されている。カラム単位の格納により、クエリが参照するカラムだけを読み込む選択的 I/O が可能になり、同一型のデータが連続して並ぶため圧縮効率も高い。主な対象ユースケースは BI レポート・ウェブ解析・イベントログ分析・時系列モニタリング等であり、インターネット規模の非正規化テーブルに対してリアルタイムレイテンシ(サブ秒)を実現することを目標とする(Source: [[@2024__PVLDB__ClickHouse - Lightning Fast Analytics for Everyone]])。
## 横断的知見
- **OLAP システムの性能差は設計選択の組み合わせに帰着する**: ClickHouse の ClickBench では、同一ワークロードで MySQL は ClickHouse の 2957 倍(コールド)の時間を要する。この差は単一の技術ではなく、カラム型格納・データプルーニング・ベクトル化実行・コードコンパイルの複合的な効果による。(Source: [[@2024__PVLDB__ClickHouse - Lightning Fast Analytics for Everyone]])
- **本番グレード OLAP システムと研究システムの間にはなお性能差が残る**: ClickBench(ホットラン)では研究システム Umbra が ClickHouse を上回るが、本番グレードでは ClickHouse が最速。これは研究システムが本番運用の複雑さ(多様なインテグレーション・デプロイモード・ACID 制約等)を外している分、クエリ実行に特化できるためと解釈できる。(Source: [[@2024__PVLDB__ClickHouse - Lightning Fast Analytics for Everyone]])
- **時系列モニタリング用途での OLAP ベンチマーク研究(TSM-Bench)は OLAP の汎用ベンチマークと評価軸が異なる**: TSM-Bench は時系列固有クエリ(ウィンドウ集計・範囲クエリ)・データ変動特性・スケーラビリティを軸にするのに対し、ClickBench は非正規化ファクトテーブルへの ad-hoc クエリを中心とする。同一「OLAP」カテゴリでもベンチマーク前提が大きく異なる。(Source: [[@2024__PVLDB__ClickHouse - Lightning Fast Analytics for Everyone]], [[@2023__PVLDB__TSM-Bench - Benchmarking Time Series Database Systems for Monitoring Applications]])
## 未解決の問い
- ClickHouse の TPC-H 結果が Snowflake に劣後する主因はジョイン再順序化・ジョイン述語プッシュダウンの欠如とされるが、これらを実装した場合の到達上限はどの程度か。
- 高インジェスト率ワークロードにおける「バックグラウンドマージのリソース消費 vs. クエリ性能」のトレードオフを本番規模で定量化した研究はあるか。
- Druid/Pinot のように「パートが永続不変(マージなし)」とする設計と、ClickHouse の「継続的マージ+データ変換」設計では、長期運用(5 年以上)でのストレージ効率・クエリ性能・運用コストにどのような差が生じるか。
- 列指向 OLAP と時系列データベース(TSDB)のユースケース境界はどこにあるか(ClickHouse は監視用途でも広く使われるが TSM-Bench では InfluxDB 等の TSDB と比較される)。
## 関連
- ソース: [[@2024__PVLDB__ClickHouse - Lightning Fast Analytics for Everyone]] / [[@2023__PVLDB__TSM-Bench - Benchmarking Time Series Database Systems for Monitoring Applications]]
- 概念: [[LSMツリー]] / [[LSMツリーコンパクション]] / [[並列データベース]] / [[データパーティショニング]] / [[時系列データベース]] / [[べき等性]] / [[結果整合性]]
- エンティティ: [[ClickHouse]] / [[ClickHouse Inc.]]
## 出典
- [[@2024__PVLDB__ClickHouse - Lightning Fast Analytics for Everyone]](§1 Introduction, §6 Performance as a Feature)
- [[@2023__PVLDB__TSM-Bench - Benchmarking Time Series Database Systems for Monitoring Applications]](時系列モニタリング OLAP ベンチマークの比較軸)