# TIME
TIME(Timeseries International Model Evaluation)は Qiao et al.(2026)が提案した、汚染耐性のゼロショット時系列予測ベンチマーク。
## 定義・背景
既存の公開ベンチマークでは、モデルの事前学習コーパスとテストデータが重複する**データ汚染(data contamination)**問題が顕在化している。TIME はこの問題に対処するため、確立済みベンチマークには存在しない新規に収集された新鮮なデータセットのみで評価セットを構成する。汚染ゼロを保証した環境でのゼロショット予測能力を測定することを主目的とする。([[@2026__arXiv__Toto 2.0 - Time Series Forecasting Enters the Scaling Era]])
## Toto 2.0 での評価結果
Toto 2.0 の評価において TIME を用いたゼロショット評価が実施され、全指標で上位 3 位を Toto 2.0(2.5B・1B・313M)が独占した(CRPS rank: 3.43・3.51・4.38)。汚染耐性環境でも Toto 2.0 のスケーリング効果と汎化能力が確認された。
## 関連
- ベンチマーク比較: [[GIFT-Eval]](汎用ゼロショット)/ [[BOOM]](観測データ特化)/ TIME(汚染耐性)
- 評価対象モデル: [[Toto]]
- 概念: [[時系列基盤モデル]]
## 出典
- [[@2026__arXiv__Toto 2.0 - Time Series Forecasting Enters the Scaling Era]](Toto 2.0 での評価)