各障害発生時に採取される観測データが同じ部分は、その障害の固有の原因を指し示さないだろうと仮定する。 新規に障害が発生するときに、過去の障害発生時の圧縮表現と比べて、「観測データが異なる部分または稀な部分」を特定すると、その部分は根本原因を含むのではないか? 技術的な挑戦は、いかに効率的に観測データの傾向が同じであると特定するかどうか。 多変量時系列を確率分布に落とし込んで、確率分布間の距離をみればよい? [[KLダイバージェンス]]