[Smart Monitor System For Automatic Anomaly Detection @Baidu | USENIX](https://www.usenix.org/conference/srecon15/program/presentation/qu) Baiduでは、何十億ものリクエストが何十万ものサーバーによってサポートされています。このように多くのサーバーやモジュールが存在するため、エンジニアにとって異常検知は大きなチャレンジとなる。異常が発生すると、様々なアラームやインシデントがエンジニアに送られる。整理されていない膨大な監視データとアラームから、根本原因を探るのは非常に困難です。そこで我々は、BIMS(Baidu Intelligent Monitoring System)と名付けたよりスマートな監視システムを構築し、エンジニアが問題を分析し、収益損失のような重要な異常について最も可能性の高い理由を提示できるようにしようとしました。 本講演では、BIMSの中核となる手順を、バイドゥの主力製品の生産環境における実際の事例で紹介します。インシデントのデータモデル、プロアクティブな異常検知アルゴリズム、相関分析、可視化などの技術について説明します。また、BIMSをベースに、SREチームのためのインテリジェントなシステムについてのアイデアも紹介します。 ## Detection Strategy - [[3σ則]] - segmented 3-sigma rule - [[K-S検定]]