## Memo ## Abstract 本論文では、パフォーマンスと耐障害性の目標を達成する能力を維持しながら、2050年までに世界全体で炭素排出量を正味ゼロに移行する緊急の必要性を取り上げる。ハイパースケール・クラウド・データセンターのような、電力を大量に消費し、二酸化炭素排出量を増加させるコンピューティング・インフラに焦点を当てる。私たちの目標は、(1)望ましいが高価で比較的不安定なグリーンエネルギー源(太陽光エネルギーなど)の使用を最適化すること、(2)コストは低いが社会的に大きな悪影響を及ぼす化石燃料の使用を継続的に削減することです。一方、クラウドデータセンターは、顧客の要求、例えばアプリケーションのレイテンシやスループットにおけるサービスレベル目標([[SLO]])を満たすよう努力しており、これらはインフラの回復力や可用性によって影響を受ける。我々は、持続可能性、クラウドの回復力、およびパフォーマンスを、相互に依存する複数の目標を持つ共同最適化問題として組み合わせ、これらの問題に総合的に対処するスケーラブルな定式化を提案する。問題の複雑性と動的性を考慮すると、継続的な最適化を達成するためには、[[強化学習]]などの機械学習(ML)アプローチが不可欠である。我々の研究は、グリーン・コンピューティングへの移行を管理するために、異種インフラにわたる革新的なML中心のソリューションが必要となる、グリーン・エネルギーの不安定性という課題を浮き彫りにしている。MLを中心としたソリューションの根底には、古典的なシステム耐障害性技術とリアルタイムML耐障害性の革新(これまで扱われていない)を組み合わせる手法が必要である。このアプローチは、レジリエントでSLO主導のグリーンエネルギー導入に新たな方向性を示すだけでなく、これまで不可能だった方法で将来の持続可能なシステムを管理することを可能にすると信じている。