## Memo ## Memo with LLM ## Abstract 遅いタスクの検出はクラウドの運用と保守において重要な問題である。なぜなら、遅いタスクはユーザー体験に大きく関係し、多額の損害賠償をもたらす可能性があるからである。 ほとんどの異常検知手法は、単一タスクの側面からこれを検知する。 しかし、大規模なクラウドコンピューティングクラスタにおける何百万もの同時タスクを考慮すると、それは非現実的で非効率的となる。 さらに、単一タスクの速度低下は非常に一般的であり、仮想環境におけるその激しい揺らぎの性質により、必ずしもクラスタの誤動作を示すとは限らない。 そこで、クラスタ全体のタスクの継続時間分布を利用することで、クラスタ全体のタスク速度低下に注目する。 タスクの継続時間分布は、多くの場合、複合的な周期性と局所的な例外的な時間変動を示す。 変換器ベースの手法は、このような時系列の正常変動パターンを捉えるための最も強力な手法の一つであるが、我々は経験的に、複合周期性を扱う際に振幅の小さいサブピリオドを再構成する際に、標準的な注意メカニズムの欠点を発見し、理論的に説明する。 このような課題に取り組むために、我々はSORN(すなわち、 これは、複合周期性を再構築するためのSkimming Attention機構と、クラスタ全体の減速を他の例外的なゆらぎと区別するためのNeural Optimal Transportモジュールから構成される。 さらに、訓練セットの異常は実用的なシナリオでは避けられないので、我々は、訓練セット中の信頼できるタイムスロットにより高い重みを適応的に割り当てるピッキーな損失関数を提案する。 広範な実験により、SORNが複数の実世界の産業データセットにおいて、最先端の手法を凌駕することが実証された。