A **Py**thon Toolbox for Machine Learning on **P**artially-**O**bserved **T**ime **S**eries
⦿ 動機: 収集センサーの故障、通信エラー、予期せぬ故障など、さまざまな理由により、現実世界の環境から得られる時系列データには欠測値が頻繁に発生します。これにより、部分的に観測された時系列データ(POTS)はオープンワールドモデリングにおける普遍的な問題となり、高度なデータ分析を妨げています。この問題は重要にもかかわらず、POTSを対象としたデータマイニング分野には専用のツールキットが不足しています。PyPOTSは、この空白を埋めるために作成されました。
⦿ ミッション:PyPOTSは、POTSにおけるデータマイニングを煩雑な作業ではなく、手軽なツールボックスとして提供し、エンジニアや研究者がデータ内の欠損部分に対処するのではなく、手元の核心的な問題に集中できるように支援することを目的としています。PyPOTSは、部分的に観測された多変量時系列データに対する古典的なデータマイニングアルゴリズムと最新の最先端アルゴリズムを継続的に統合していきます。もちろん、多様なアルゴリズムに加え、PyPOTSはアルゴリズム間を横断する統一されたAPI、詳細なドキュメント、およびチュートリアルとしてのインタラクティブな例を提供します。
code: [GitHub - WenjieDu/PyPOTS: A Python toolkit/library for reality-centric machine/deep learning and data mining on partially-observed time series, including SOTA neural network models for scientific analysis tasks of imputation/classification/clustering/forecasting/anomaly detection/cleaning on incomplete industrial (irregularly-sampled) multivariate TS with NaN missing values](https://github.com/WenjieDu/PyPOTS)
paper: [[2025__IJCAI__Deep Learning for Multivariate Time Series Imputation - A Survey]]
service: https://time-series.ai/