# Datadog
## 定義
Datadog は observability / 監視の SaaS ベンダで、Logs(Log Management・Error Tracking)・Traces(APM)・Metrics・Alerts を統合する production telemetry プラットフォームを提供する。自社を「the largest dataset of production telemetry data in the industry」と位置づけ、その上に自律 SRE エージェント [[Bits AI SRE]] を構築している。([[2026__Datadog__Building Bits AI SRE - Autonomous Incident Investigation Agent]])
## 役割・位置づけ
- [[Bits AI SRE]] を **Service Management** 製品カテゴリ(Incident Response・Workflow Automation と並ぶ)で提供する。
- [[Google]] に次ぐ本 wiki 2 例目の産業界一次情報の出所。Google が自社 SRE 運用の whitepaper を出すのに対し、Datadog は監視ベンダとして**顧客の telemetry を入力に取る**調査エージェントを製品化する立場。
- 強みは保有する production telemetry の規模——自社サービスの障害だけでなく多数の顧客環境の運用データにアクセスできる点。
- AI Research 部門が [[Carnegie Mellon University]] と共同で観測データ特化の[[時系列基盤モデル]] [[Toto]] と benchmark [[BOOM]] を開発・オープンソース化(Apache 2.0)。Toto/BOOM の観測データは顧客データを除く自社内部監視メトリクスのみを出所とし、production(訓練)と staging(評価)を分離して汚染を防ぐ。保有 telemetry の規模が事前学習コーパス(主要 TSFM の4〜10倍)の源泉となっている。
## 関連
- エンティティ: [[Bits AI SRE]] / [[Toto]] / [[BOOM]] / [[Carnegie Mellon University]] / [[Google]](産業界の対比)
- ソース: [[2026__Datadog__Building Bits AI SRE - Autonomous Incident Investigation Agent]] / [[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]]
- 概念: [[根本原因分析]] / [[agentic SRE]] / [[AIOps]] / [[時系列基盤モデル]]
- 関連 MOC: [[Telemetry - MOC]] / [[SRE - MOC]] / [[時系列基盤モデル - MOC]]
## 出典
- [[2026__Datadog__Building Bits AI SRE - Autonomous Incident Investigation Agent]]
- [[2025__NeurIPS2025__This Time is Different - An Observability Perspective on Time Series Foundation Models]]