[Next Generation of DevOps: AIOps in Practice @Baidu | USENIX](https://www.usenix.org/conference/srecon17asia/program/presentation/qu)
Abstract:
> Baiduには数千のアプリケーションと数十万のサーバーがあります。 高可用性と高信頼性のサービスを提供するために、当社のSREは多くの運用ツールやシステムを開発してきました。 しかし、これらのツールは様々な運用コンセプト、実行環境、運用戦略が異なるため、再利用や拡張が困難です。 そこで私たちは、SREがより迅速かつ効率的に運用ツールを開発できるよう、[[AIOps]]プラットフォーム(AIは自動化とインテリジェンスの意味)というプラットフォームを構築しました。 このプラットフォームは、統一されたオペレーション抽象化レイヤ、オペレーション戦略、自動スケジューリングと実行を提供します。 本講演では、AIOpsプラットフォームのコアとなる手順について、百度の基幹製品の実運用環境における実例を交えて紹介します。 プラットフォーム・アーキテクチャ、OKB(運用知識ベース)、OPAL(運用抽象化レイヤ)、フェイルオーバー、オートスケーリングなどのプラクティスなどです。