# Oak Ridge National Laboratory
米国エネルギー省(DOE)が所管する国立研究所(ORNL)。スパコン [[Summit]] を運用し、その冷却・電力インフラの長期テレメトリを保有する。(Source: [[@2025__ISAV__From Exploration to Explanation - ML-Driven Causal Discovery for Datacenter Reliability at Scale]])
- ISAV 2025 の [[PACE]] 論文では ORNL 側の Wesley Brewer が著者に連なり、[[Hewlett Packard Labs]] との共同研究として行われた。
- PACE の評価データは ORNL の [[Summit]] スパコンの冷却インフラの 7 年分のテレメトリ(Yokogawa SMARTDAC 監視システムで収集)で、冷却塔の入口・出口温度、ポンプ流量、チラー状態、熱交換器性能など数十〜数百の相互依存する施設メトリクスを含む。
ORNL の Oak Ridge Leadership Computing Facility(OLCF)は米国初のエクサスケールスパコン [[Frontier]] を運用しており、そのセンターワイド並列ファイルシステムとして約 700 PB の [[Lustre]] ベースファイルシステム [[Orion]] を導入している。Lustre Unveiled 論文では ORNL NCCS の [[Anjus George]]、[[Sarp Oral]] ら 10 名が著者に連なり、Orion の設計・性能データを詳細に報告した。(Source: [[@2025__TOS__Lustre Unveiled - Evolution, Design, Advancements, and Current Trends]])
## 関連
- ソース: [[@2025__ISAV__From Exploration to Explanation - ML-Driven Causal Discovery for Datacenter Reliability at Scale]] / [[@2025__TOS__Lustre Unveiled - Evolution, Design, Advancements, and Current Trends]]
- 所属研究者: [[Wesley Brewer]] / [[Anjus George]] / [[Sarp Oral]]
- 共同研究先: [[Hewlett Packard Labs]]
- 関連プロダクト: [[Summit]] / [[PACE]] / [[Frontier]] / [[Orion]] / [[Lustre]]
- 概念: [[根本原因分析]] / [[テレメトリ]]