[[2022__ICSE-SEIP__MicroHECL - High-Efficient Root Cause Localization in Large-Scale Microservice Systems]]より以下に引用。
- パフォーマンス異常:パフォーマンス異常は、応答時間(RT)の異常な増加で示されます。通常、実装に問題がある場合や、環境設定(コンテナや仮想マシンのCPU/メモリ構成など)が適切でない場合に発生します。
- 信頼性異常:信頼性異常は、エラーカウント(EC)、すなわちサービスコールの失敗数の異常な増加によって示されます。通常、コードの不具合や環境障害(サーバーやネットワークの停止など)による例外が原因である。
- トラフィックアノマリー:トラフィックの異常は、1秒あたりのクエリー数(QPS)の異常な増減で示されます。トラフィックの異常な増加はサービスを停止させる可能性があり、異常な減少は多くのリクエストがサービスに到達できないことを示す可能性があります。トラフィックの異常は通常,不適切なトラフィック設定 (例: Nginx [17] のトラフィック制限) や DoS 攻撃,予期せぬストレステストによって引き起こされる.