# UCR Time Series Archive ## 定義 UCR Time Series Archive は、現時点で最大の公開ラベル付き時系列データセットコレクションである。128データセットを収録し、バイオシグナル、モーションキャプチャ、画像ベースデータ、スペクトル/音声データ、デバイス/電力データ等の多様な応用ドメインを含む。各データセットは40〜24,000本の時系列を含み、系列長は15〜2,844の範囲である。全データは z 正規化されている。(Chen+ 2015; [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]]) ## 役割・位置づけ - 時系列分類・クラスタリング研究における事実上の標準ベンチマークとして広く採用されている。 - [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]] では全128データセットを用いて84手法を評価し、統計的検定を実施した。 - 基盤モデル MOMENT が事前学習に UCR データセットを使用しており、評価時のデータ汚染問題が Paparrizos+ 2025 で指摘されている。 ## 関連 - ソース: [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]] - 概念: [[時系列クラスタリング]] ## 出典 - [[@2025__PVLDB__Time-Series Clustering - A Comprehensive Study of Data Mining, Machine Learning, and Deep Learning Methods]]