# GIFT-Eval
## 定義
GIFT-Eval(Aksu+, 2024、arXiv:2410.10393)は、汎用時系列予測モデル評価のための benchmark。15 個の univariate と 8 個の multivariate dataset からなり、7 ドメイン・10 周波数を跨ぐ。総計 144,000 系列・1.77 億観測点。([[2026__arXiv__Falcon-X - A Time Series Foundation Model for Heterogeneous Multivariate Modeling]] からの言及)
## 役割・位置づけ
- 予測長は dataset・周波数・ドメインに応じ短期(48 ステップ)・中期(10×)・長期(15×)に分け、計 97 構成。性能は構成間の幾何平均で報告。MASE・CRPS で評価。
- web/cloudops ドメインに BizITObs(Application/Service/L2C)・Bitbrains 等の観測系時系列を含む。
- [[Falcon-X]] はここで 0.666 MASE / 0.453 CRPS の全体最高を達成。Falcon-X の事前学習コーパスは GIFT-Eval の pretrain 部分も利用するが、test との leakage を避ける選定をしたと記載。
- [[Toto]]/[[BOOM]] 論文でも汎用 benchmark として参照され、観測データ特化 benchmark BOOM(約 158M 観測点)と対比される。
## 関連
- エンティティ: [[Falcon-X]]・[[Chronos-2]]・[[Toto]](評価対象モデル)/ [[fev-bench]]・[[BOOM]](関連 benchmark)
- 概念: [[時系列基盤モデル]] / [[多変量時系列予測]]
- ソース: [[2026__arXiv__Falcon-X - A Time Series Foundation Model for Heterogeneous Multivariate Modeling]]
## 出典
- [[2026__arXiv__Falcon-X - A Time Series Foundation Model for Heterogeneous Multivariate Modeling]]