## Memo [GitHub - fraunhoferportugal/tssearch: A Python library for time series subsequence search.](https://github.com/fraunhoferportugal/tssearch) ## Abstract 時系列データマイニングにおいて、部分配列検索と距離測定は非常に重要なツールである。本論文では、時系列における部分配列検索と類似度測定のための包括的なメソッド群を提供する、TSSEARCHと名付けられた我々のPythonパッケージを紹介する。これらの手法はユーザがカスタマイズ可能であり、より柔軟かつ効率的に実際の導入シナリオに統合することができる。TSSEARCHは高速な探索的時系列データ解析を可能にし、人間の活動認識と屋内位置特定という文脈で検証された。 ## 1. Motivation and significance 時系列データマイニングアルゴリズムでは、サブルーチンとして部分配列探索を用いる。部分配列探索は、音楽情報検索 [1]、歩行分析 [2]、屋内位置特定 [3]などの多くの分野で、データ中の共通パターンや振る舞いを見つけるために使われてきた、有用な探索ツールである。 ここで、2つの時系列Q := (q1,q2,...,qN) とY := (y1 , y2 , ... , yM ) をそれぞれ長さNとMで定義するとする。時系列に対する部分列探索問題は,問合せQ とより長い対象時系列Y が与えられたとき,Qに対する類似度測定を最小化する,Yi から始まるY の最良の部分列の集合を求める,と正式に定義できる(i はそれぞれの部分列の最初の瞬間) [4]. 本論文では、TSSEARCHと名付けられたPythonパッケージを紹介する。このパッケージは、時系列に対するクエリベースの部分配列検索のための技術と、一般的に用いられる距離測定の実装を提供するものである。TSSEARCHは一変量と多変量の時系列の両方をサポートし、時系列距離や部分配列検索方法を追加することで、コミュニティによって容易に拡張できるように書かれている。 文献上では、TSdist [5]やdtaidistance [6]などの時系列に対する基本的な距離尺度を持つ関連パッケージが利用可能になっています。また、pyts [7] や sktime [8] などの補完的なパッケージは、探索問題とは異なる教師あり学習問題に焦点をあてています。もう一つの例は[[tslearn]] [9]で,これは完全な開発パイプラインのための支援ツールを備えた汎用の機械学習ライブラリである.しかし、上記のパッケージはどれも副次的な配列探索の問題への対処に焦点をあてていない。この問題はUCR Suite [10]で解決され、広範なデータセットに対して最適化された部分配列検索が可能になった。しかし、そのソフトウェア実装は容易に拡張できるものではない。これらのパッケージと比較して、TSSEARCHは部分配列検索の問題に焦点を当て、付加的な機能を持つ高度にカスタマイズ可能なクエリベース検索を行うことができる。 現在、TSSEARCHは人間の活動認識[11]における繰り返し動作の分割や、屋内位置特定[3]における類似位置パターンの探索に利用されている。 本論文の残りの部分では、実装されたアーキテクチャと機能の概要、初歩的な使用例、およびこのトピックに関する将来の研究を喚起するための影響と貢献を紹介する。