# UCR Time Series Archive
## 定義
UCR Time Series Archive は、現時点で最大の公開ラベル付き時系列データセットコレクションである。128データセットを収録し、バイオシグナル、モーションキャプチャ、画像ベースデータ、スペクトル/音声データ、デバイス/電力データ等の多様な応用ドメインを含む。各データセットは40〜24,000本の時系列を含み、系列長は15〜2,844の範囲である。全データは z 正規化されている。(Chen+ 2015; [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]])
## 役割・位置づけ
- 時系列分類・クラスタリング研究における事実上の標準ベンチマークとして広く採用されている。
- [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]] では全128データセットを用いて84手法を評価し、統計的検定を実施した。
- 基盤モデル MOMENT が事前学習に UCR データセットを使用しており、評価時のデータ汚染問題が Paparrizos+ 2025 で指摘されている。
## 関連
- ソース: [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]]
- 概念: [[時系列クラスタリング]]
## 出典
- [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]]