# PISA **Prompt based tIme Series forecAsting** の略。[[Hao Xue]]・[[Flora Salim]]([[University of New South Wales]])が PromptCast パラダイムの研究を支援するために構築した大規模データセット。 ## 概要 3 つの実世界時系列シナリオから 311,932 インスタンスを収集し、数値形式(PISA-numerical)と自然言語プロンプト形式(PISA-prompt)の 2 形式で提供する。 | サブセット | 対象 | インスタンス数(総計) | 値域 | |-----------|------|---------|-----| | CT(City Temperature) | 110 都市の日次平均気温 | 128,810 | [-44, 104]°F | | ECL(Electricity Consumption Load) | 50 ユーザーの日次電力消費 | 52,550 | [2799, 24906] kWh | | SG(SafeGraph Human Mobility) | 324 POI の日次来訪者数 | 130,572 | [3, 383] 人 | - **観測長**: 15 日(デフォルト) - **分割比**: train/val/test = 7:1:2(時系列順) - **ライセンス**: CC BY-NC-SA 4.0 - **配布**: https://github.com/HaoUNSW/PISA / HuggingFace Datasets ## データ源 - CT: Dayton 大学 Average Daily Temperature Archive(研究・非商用目的) - ECL: UCI Machine Learning Repository(Electricity Load Diagrams 2011-2014、Apache 2.0) - SG: SafeGraph Weekly Patterns(SafeGraph Data for Academics 経由、再配布不可・集計データのみ可) ## 倫理的配慮 オブジェクトIDはランダム付番で匿名化。位置情報(SG の POI ジオロケーション)は提供しない。個人情報を含む集計統計のみ使用。 ## 関連 - ソース: [[@2022__arXiv__PromptCast - A New Prompt-based Learning Paradigm for Time Series Forecasting]] - 作成者: [[Hao Xue]] / [[Flora Salim]] - 関連概念: [[LLM時系列アプローチ]] / [[多変量時系列予測]]