## Memo ## Abstract クラウドの回復力は、クラウド事業者とクラウドに依存する無数のアプリケーションにとって極めて重要である。今日、クラウド事業者がパブリック・クラウドのアプリケーション・パフォーマンスを優雅に劣化させるメカニズムが欠けている。本稿では、3つのアプローチからなる自動機能劣化のビジョンを提示する。第一に、重要なサービスの可用性を最大化するために、対角スケーリング(容量不足のシナリオ中にアプリケーションの依存関係グラフを刈り込むこと)のアイデアを紹介する。第二に、アプリケーションを変更することなく、アプリケーション開発者の回復力の意図をクラウドプロバイダーに伝えるために、マイクロサービス上でシンプルで表現力豊かなCriticalityタグの使用を提案します。第三に、オペレータの目的も考慮しながら、アプリケーションのクリティカルなサービスの可用性を最大化する自動化されたクラウド・レジリエンス管理システムであるGeckoを設計する。広範な実験により、[[Kubernetes]]上で動作するGeckoコントローラが、広範な障害シナリオの下でアプリケーションとインフラの全体的な回復力を最大化できることを示す。また、Geckoを用いた対角スケーリングがマイクロサービスアーキテクチャとうまく整合することを、実世界のアプリケーションを用いた実験により実証します。