# BOOM ## 定義 BOOM(Benchmark of Observability Metrics)は [[Datadog]] が公開した、観測時系列予測のための大規模オープン benchmark。2,807個の異なる多変量時系列・約3.5億観測点からなり、全データが実運用の分散システム監視由来の観測メトリクスである。([[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]]) ## 役割・位置づけ - 規模は汎用 benchmark GIFT-Eval の約2倍の総観測点(350M vs 158M)。系列数は少ないが(2,807 vs 144K)、系列あたり variates 中央値は60と高次元(GIFT-Eval は1)。 - ドメイン分類: Application Usage(41.3%)/ Infrastructure(34.4%)/ Database(29.3%)/ Networking(10.0%)/ Security(0.3%)。LLM で初期ラベル付けし人手検証。 - 訓練データ(Toto, production 環境)との汚染防止のため、評価データは別の staging 環境から取得。顧客データを除く自社内部監視のみ。 - 評価は GIFT-Eval プロトコル準拠(MASE・CRPS を Seasonal Naive 正規化)だが、定数部分列対策で集約に shifted geometric mean を採用。アクセス容易化のための小規模部分集合 BOOMLET も提供。 - 統計的特性(§4.3): ACF・ARCH-LM・spectral entropy・KPSS・flat spots・skew のいずれも汎用 benchmark より極端で、観測データの非定常性・不規則性・裾の重さを反映。 - データ・評価コードは Apache 2.0 で公開(<https://huggingface.co/datasets/Datadog/BOOM>)。 ## 関連 - エンティティ: [[Datadog]](公開元)/ [[Toto]](同時公開のモデル) - ソース: [[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]] - 概念: [[時系列基盤モデル]] - 関連 MOC: [[時系列基盤モデル - MOC]] / [[異常検知 - MOC]] / [[Telemetry - MOC]] ## 出典 - [[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]]