## Memo ## Abstract 本番環境における障害を予測することで、サービスプロバイダは、アプリケーションのユーザに危害を与えないような対策を講じることができる。最も成功しているアプローチは、エラー状態から障害を予測するものであるが、現在のアプローチは、実行時に収集された固定 KPI 値セットの時系列の異常から特定する。これらのアプローチは、時間とともに変化するサイズの KPI セットの時系列を扱うことができません。したがって、これらのアプローチは、静的に構成されたコンポーネントと計算ノードのセットで実行されるアプリケーションで機能し、自動スケーリングを利用する多くの一般的なクラウドアプリケーションにはスケールアップしない。 本稿では、自動スケーリングを利用するクラウドアプリケーションの障害を予測する新しいアプローチであるPREFACEを提案する。PREFACEはもともと、静的に構成されたアプリケーションの障害を予測するために利用されてきたニューラルネットワークベースの障害予測器を、クラウドのオートスケーリングアプリケーションで収集されるような非常に可変的なサイズのKPIセットを処理し、それらのKPIをニューラルネットワーク予測器に供給できる固定サイズの整流KPIセットに削減する整流器レイヤで補強している。PREFACE Rectifier は、ターゲットアプリケーションの論理コンポーネントごとに、元の KPI の記述統計量として整流化 KPI を計算する。記述統計量は、異なるタイムスタンプで収集された変動性の高い KPI セットを、ニューラルネット ワーク故障予測システムの入力ノードと互換性のある固定値のセットに縮小する。そして、ニューラルネットワークは、エラー状態に対応する異常を、アプリケーションのユーザに害を与える障害に伝播する前に明らかにすることができる。商用アプリケーションと広く利用されている学術的な模範例の両方に対する実験により、PREFACE は、適切な対策を発動するのに十分なほど早期に、多くの有害な障害を実際に予測できることが確認された。