# 時系列データベース
## 定義
時系列データベース(TSDB)は、(1) timestamp・value・任意の tags からなる行を保存し、(2) 複数の時系列をまとめて保存し、(3) 行を query でき、(4) query に timestamp / 時間範囲を含められる DBMS(Bader らの定義)。time series は「系列識別子 + (timestamp, value) のデータ点列」で表される。([[2025__Kyoto University__Scaling Telemetry Workloads in Cloud Applications - Techniques for Instrumentation, Storage, and Mining]]) アーキテクチャは 2 系統に大別される: **TSDA(Time Series Data-Intensive Application)** は汎用 DBMS(HBase/Cassandra 等の KVS)上に取り込み/クエリのインタフェースを載せたアプリ(OpenTSDB・KairosDB)で、自動クラスタ管理を活かし運用が楽。**TSDBMS(Time Series DBMS)** は時系列特化のストレージエンジンを持つ DBMS(Gorilla・InfluxDB・Prometheus・VictoriaMetrics)で、Gorilla 圧縮等で高い取り込み率を出すが運用は自前。([[2025__Kyoto University__Scaling Telemetry Workloads in Cloud Applications - Techniques for Instrumentation, Storage, and Mining]])
## 横断的知見
- **インデックス構造の選択が取り込みスケーラビリティを決める**: disk-based KVS は sort 指向の tree 系インデックス(balanced tree / skip-list)で、多数キー挿入が対数時間でボトルネック化する。hash table は定数時間挿入だがランダムアクセスゆえ memory-based DB 向き。[[HeteroTSDB]] はこの非対称性を逆手にとり、memory-KVS(hash table・高速挿入)と disk-KVS(低コスト長期保持)を **TTL ベース自動 tiering** で federate して両取りする。([[2025__Kyoto University__Scaling Telemetry Workloads in Cloud Applications - Techniques for Instrumentation, Storage, and Mining]])
- **保持する DB と予測するモデルが同じ観測時系列を別軸で攻める**: TSDB(本概念)は観測 telemetry の「取り込み・保持・範囲クエリ」を効率化する。[[時系列基盤モデル]]([[Toto]]・[[Falcon-X]])は同じ観測時系列の「zero-shot 予測」を担う。[[BOOM]] は production telemetry を予測 benchmark 化したが、その telemetry を生成・保持する側が TSDB であり、両者は観測データのライフサイクルの別段を占める(保持 → 予測)。(Source: [[2025__Kyoto University__Scaling Telemetry Workloads in Cloud Applications - Techniques for Instrumentation, Storage, and Mining]], [[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]])
## 未解決の問い
- HeteroTSDB は到着順格納のためクエリ時に timestamp ソートを要し、disk-KVS の balanced tree より遅い。取り込み最適化と読み出し性能のトレードオフを両立する index 設計はあるか(クエリ性能評価は論文でも将来課題)。
- 将来の telemetry は機械学習(異常検知・予測)による分析クエリが増え、繰り返し学習が取り込みと競合しうる。学習ワークロードを前提にした TSDB の設計は何か([[時系列基盤モデル]] の推論を TSDB に組み込む可能性)。
- TSDA は front-end↔KVS 間の通信オーバーヘッドが TSDBMS に対する不可避の不利。この差を埋める手法(co-location・in-process 化)はあるか。
## 関連
- ソース: [[2025__Kyoto University__Scaling Telemetry Workloads in Cloud Applications - Techniques for Instrumentation, Storage, and Mining]] / [[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]]
- 概念: [[テレメトリ]] / [[時系列基盤モデル]] / [[多変量時系列予測]]
- エンティティ: [[HeteroTSDB]] / [[Mackerel]] / [[BOOM]]
- 関連 MOC: [[SRE - MOC]]
## 出典
- [[2025__Kyoto University__Scaling Telemetry Workloads in Cloud Applications - Techniques for Instrumentation, Storage, and Mining]](§4.1–4.7 HeteroTSDB、TSDA/TSDBMS 分類・tiering・TTL migration)