# Summit
[[Oak Ridge National Laboratory]] が運用するスパコン。冷却・電力インフラの長期テレメトリを保有する。(Source: [[@2025__ISAV__From Exploration to Explanation - ML-Driven Causal Discovery for Datacenter Reliability at Scale]])
- [[PACE]] の評価データは Summit の冷却インフラの 7 年分のテレメトリで、Yokogawa SMARTDAC 監視システムで収集された施設メトリクス(冷却塔の入口・出口温度、ポンプ流量、チラー状態、熱交換器性能など数十〜数百の相互依存する指標)を含む。主な実験は欠損が少なく動作条件が多様な 3 ヶ月の代表ウィンドウで実施された。
- 先行研究は Summit の電力・熱・冷却ダイナミクスを相関に着目して記述したが、PACE はそこに有向の因果探索を加える位置づけ。
## 関連
- ソース: [[@2025__ISAV__From Exploration to Explanation - ML-Driven Causal Discovery for Datacenter Reliability at Scale]]
- 運用機関: [[Oak Ridge National Laboratory]]
- 関連プロダクト: [[PACE]]
- 概念: [[テレメトリ]] / [[根本原因分析]]