本研究はクラウドアプリケーションにおける障害の局所化に焦点を当てているが、MetricSifterは数値時系列データを使用する他の分野にも応用できる可能性がある。
その際は問題を一般化し、任意の問題空間に生じる異常の根本原因を特定するというものになる。
ロボティクス・制御工学・宇宙工学分野では、工作機械や人工衛星から読み取る温度、振動、電流、圧力などのセンサ情報から故障原因を特定する、宇宙工学では人工衛星のセンサー情報から故障原因を特定する、医学では、生体信号に基づき患者の急変原因を推定する、といったことが研究されている。
人工衛星テレメトリデータは高次元であり、通常、数百から数千の変数から構成されることが知られており、これは本研究の実験に用いたデータセットと同等程度のサイズである。
いくつかの文献で、特徴量削減あるいは同等の意味で用いられる次元削減の必要性が述べられている。
[[2019__Artificial Intelligence Review__Machine learning in telemetry data mining of space mission - basics, challenging and future directions]]
> It is clear that satellite telemetry data has very high dimensions, usually consisting of hundreds to thousands of variables.
MetricSifterが有効に機能する前提は、次の3点である。これらの前提を満たすドメインへはMetricSifterの適用可能性がある。
第一に、異常の発生の影響が時系列データに変化点を生じさせる。
第二に、異常の影響がなんらかの媒介を通じて他のコンポーネントへ伝搬する。
第三に、問題空間内の異なる時系列データ間の異常起因の変化点に時間的な近接性がある。これは、原因事象が発生してから症状としての異常が現れるまでの伝搬時間差が小さいことを示す。
第一の前提は、時系列データの異常検知と変化点検知アルゴリズムが工学や医療、金融ドメインにおいて盛んに研究されているから、それらのドメインでは満たされる可能性がある。
第二の前提は、神経系・ウイルス感染・電力網・無線センサーネットワークなど様々なドメインでノード間で信号が伝搬し、複雑ネットワークを形成することが知られている。そのため、異常という信号がシステム内を伝搬するモデリングが有効なケースは多数あるであろう。 [[2023__Physics Reports__Signal propagation in complex networks|Peng Ji+, Physics Reports2023]]
第三の前提を明確に述べている文献は少ないが、コンポーネント間が固体同士の接触または電気通信により接続されているシステムであれば、システム内に発生する作用が高速に伝搬する可能性がある。その一方で、気象学では、Climatic teleconnectionsが数日から数ヶ月かかるため、気候の異常の伝搬時間の分布にばらつきが生じやすい。このようなケースでは、第三の前提を満たさないだろう。
[[2019__Science Advances__Detecting and quantifying causal associations in large nonlinear time series datasets]]
変化点検知アルゴリズムの3要素の一つのコスト関数の選択は、検出可能な異常パターンに対して敏感である。
本研究で選択する平均シフト以外の他のコスト関数を選択することにより、他のドメインへの適用性が高まる。
今回はできなかったが、他の故障と区別しやすくできる可能性がある。