# LLMAD
LLM を直接 fine-tuning なしで時系列異常検知(TSAD)に使うフレームワーク。著者は「LLM を TSAD に直接使った最初の研究」と位置づける。GPT-4-1106-preview をベース LLM とし、(i) FastDTW で正常・異常両方の履歴系列を Top-K 検索する Time Series ICL、(ii) Anomaly Detection Chain-of-Thought(AnoCoT、判定ルール・8 種の異常タイプ定義・3 段階のアラームレベル定義 + 大域 → 局所 → 再評価の 3 ステップ推論)を組み合わせる。出力は点別異常ラベルに加えて自然言語の説明、異常タイプ、アラームレベルを JSON で返す。KPI/WSD/Yahoo の平均 Best F1 = 0.759 で TFAD(0.725)を上回り、年間運用コスト約 $65.70。([[@2025__KDD__Large Language Models can Deliver Accurate and Interpretable Time Series Anomaly Detection]])
- 提案: [[Jun Liu (UCAS)]]・[[Chaoyun Zhang]]・[[Jiaxu Qian]]・[[Minghua Ma]]・[[Si Qin]]・[[Chetan Bansal]]・[[Qingwei Lin]]・[[Saravan Rajmohan]]・[[Dongmei Zhang]](Microsoft + UCAS + ZJUT)
- 発表: KDD 2025(DOI:10.1145/3711896.3737239)、プレプリント arXiv:2405.15370(2024-05-24)
- 出力する 8 種の異常タイプ: Single Spike、Single Dip、Multiple Spikes、Multiple Dips、Persistent Level Shift Up/Down、Transient Level Shift Up/Down。
- アラームレベル: Warning、Important、Urgent/Error。
- ICL の最適パラメータ: 動的検索の 2 positive / 1 negative(WSD で Best F1 0.711、ゼロショット 0.512 比)。
- GPT-4 級でないと性能が出ない(Llama-3-70B/GPT-3.5 では実用域に届かない)。
- リクエストあたり約 17 秒のレイテンシのため秒以下サンプリングには不向き、1 分粒度以上で実用。
## 関連
- 著者: [[Jun Liu (UCAS)]] / [[Chaoyun Zhang]] / [[Jiaxu Qian]] / [[Minghua Ma]] / [[Si Qin]] / [[Chetan Bansal]] / [[Qingwei Lin]] / [[Saravan Rajmohan]] / [[Dongmei Zhang]]
- 所属: [[Microsoft]] / [[University of Chinese Academy of Sciences]] / [[Zhejiang University of Technology]]
- 関連概念: [[異常検知]] / [[LLM時系列アプローチ]] / [[時系列異常検知ベンチマーク]] / [[文脈内学習]] / [[Chain-of-Thought Prompting]]
- 関連手法: [[AnoCoT]] / [[LLMTime]] / [[Anomaly Transformer]]
- ソース: [[@2025__KDD__Large Language Models can Deliver Accurate and Interpretable Time Series Anomaly Detection]]