# PISA
**Prompt based tIme Series forecAsting** の略。[[Hao Xue]]・[[Flora Salim]]([[University of New South Wales]])が PromptCast パラダイムの研究を支援するために構築した大規模データセット。
## 概要
3 つの実世界時系列シナリオから 311,932 インスタンスを収集し、数値形式(PISA-numerical)と自然言語プロンプト形式(PISA-prompt)の 2 形式で提供する。
| サブセット | 対象 | インスタンス数(総計) | 値域 |
|-----------|------|---------|-----|
| CT(City Temperature) | 110 都市の日次平均気温 | 128,810 | [-44, 104]°F |
| ECL(Electricity Consumption Load) | 50 ユーザーの日次電力消費 | 52,550 | [2799, 24906] kWh |
| SG(SafeGraph Human Mobility) | 324 POI の日次来訪者数 | 130,572 | [3, 383] 人 |
- **観測長**: 15 日(デフォルト)
- **分割比**: train/val/test = 7:1:2(時系列順)
- **ライセンス**: CC BY-NC-SA 4.0
- **配布**: https://github.com/HaoUNSW/PISA / HuggingFace Datasets
## データ源
- CT: Dayton 大学 Average Daily Temperature Archive(研究・非商用目的)
- ECL: UCI Machine Learning Repository(Electricity Load Diagrams 2011-2014、Apache 2.0)
- SG: SafeGraph Weekly Patterns(SafeGraph Data for Academics 経由、再配布不可・集計データのみ可)
## 倫理的配慮
オブジェクトIDはランダム付番で匿名化。位置情報(SG の POI ジオロケーション)は提供しない。個人情報を含む集計統計のみ使用。
## 関連
- ソース: [[@2022__arXiv__PromptCast - A New Prompt-based Learning Paradigm for Time Series Forecasting]]
- 作成者: [[Hao Xue]] / [[Flora Salim]]
- 関連概念: [[LLM時系列アプローチ]] / [[多変量時系列予測]]