2024__NSDI__OPPerTune - Post-Deployment Configuration Tuning of Services Made Easy

## Memo ## Memo with LLM ## Abstract 実際のシステム展開では、数百の相互依存する設定パラメーターが存在し、その多くがパフォーマンスと効率に大きな影響を及ぼします。現代の複雑で動的なサービスにおいて、オペレーターはサービスが広く展開された後も、適切な設定値を継続的に監視し調整する（設定チューニング）必要があります。これは、展開後に異なる設定を実験すると、アプリケーションのパフォーマンスが低下したり、サービスの中断を引き起こす可能性があるため、困難な課題です。最先端の機械学習（ML）アプローチは構成チューニングの自動化に役立ちますが、展開済みアプリケーションのエンドツーエンド構成チューニングにおける複数の課題を完全に解決していません。本論文では、Microsoftで展開中のアプリケーションの構成チューニングを可能にするサービス「OPPerTune」を提案します。OPPerTuneは、ワークロードや基盤インフラストラクチャの変化に応じて、アプリケーションのパフォーマンスを最大化しつつ、アプリケーションの中断を最小限に抑えます。OPPerTuneは、デプロイ後の構成チューニングを促進する3つの重要なプロセスを自動化します：(a) チューニング対象の構成を特定する、(b) 構成のチューニング範囲を自動的に管理する、(c) 数値型とカテゴリ型の構成を同時に迅速にチューニングする新たな[[強化学習]]アルゴリズムを使用し、構成チューニングのオーバーヘッドを低減します。私たちは、Microsoft Azureのクラスター上で2つのエンタープライズアプリケーションにOPPerTuneをデプロイしました。実験結果から、OPPerTuneが中断を削減することが示されました。