Salesforceによる時系列データの[[機械学習]]ライブラリ
- コード [GitHub - salesforce/Merlion: Merlion: A Machine Learning Framework for Time Series Intelligence](https://github.com/salesforce/Merlion)
- 論文 [[2021__Merlion - A Machine Learning Library for Time Series]]
Merlionは、時系列インテリジェンスのためのPythonライブラリです。データの読み込みと変換、モデルの構築と学習、モデル出力の後処理、モデル性能の評価など、エンド・ツー・エンドの機械学習フレームワークを提供しています。一変量および多変量時系列の予測や異常検知など、様々な時系列学習タスクをサポートしています。このライブラリは、エンジニアや研究者が特定の時系列ニーズに対応したモデルを迅速に開発し、複数の時系列データセットでベンチマークを行うためのワンストップ・ソリューションを提供することを目的としています。
Merlionの主な特徴は以下の通りです。
- 標準化され、拡張が容易なデータローディングとベンチマークにより、幅広い予測データセットと異常検知データセットに対応します。
- 異常検知と予測の両方に対応する多様なモデルのライブラリを、共通のインターフェースのもとに統合しています。モデルには、古典的な統計手法、木のアンサンブル、深層学習アプローチなどが含まれます。上級者は、各モデルを自由に設定することができます。
- 抽象的なDefaultDetectorとDefaultForecasterのモデルは、効率的で、ロバストに良いパフォーマンスを達成し、新しいユーザに出発点を提供します。
- ハイパーパラメータの調整とモデル選択を自動化する[[AutoML]]
- 異常検知器のための実用的な後処理ルールで、異常スコアをより解釈しやすくすると同時に、偽陽性の数を減らすことができます。
- 複数のモデルの出力を組み合わせて、よりロバストなパフォーマンスを実現する、使いやすいアンサンブル。
- 本番環境でのモデルのライブデプロイメントと再トレーニングをシミュレートし、予測と異常検知の両方のパフォーマンスを評価する柔軟な評価パイプライン。
- モデルの予測値を可視化するためのネイティブサポート