## Memo
- [[2005__Pattern Recognit__Clustering of time series data—a survey]]の被引用文献のトップ
- ユークリッド距離が意外と優れている。
## Abstract
[[クラスタリング]]は、クラスに関する初期の知識がない場合に、膨大なデータを分類するためのソリューションである。近年、クラウドコンピューティングやビッグデータといった新しい概念とその膨大なアプリケーションの出現により、この雪崩のようなデータから知識を抽出するためのクラスタリングアルゴリズムのような教師なしソリューションに関する研究が増えてきている。時系列データのクラスタリングは、データアナリストが複雑で巨大なデータセットから価値ある情報を抽出するためのパターンを発見するために、様々な科学分野で使用されてきた。巨大なデータセットの場合、教師ありの分類解を用いることはほとんど不可能であるが、クラスタリングは教師なしアプローチを用いてこの問題を解決することができる。本研究では、クラスタリング問題でよく用いられるデータ型の一つであり、生物学における遺伝子発現データから金融における株式市場分析まで幅広く利用されている時系列データに焦点を当てる。このレビューでは、[[時系列クラスタリング]]の4つの主要なコンポーネントを紹介し、過去10年間の時系列クラスタリングアプローチの効率、品質、複雑さの改善傾向に関する最新の調査を行い、将来の研究のための新しい道を啓発することを目的としています。
[[2015__Information Systems__Time-series clustering – A decade review__translations]]