## Memo
## Abstract
ノード間のやりとりをトレースして分析することは、複雑な分散システムでは避けて通れない、性能、正確性、信頼性の問題を明らかにするための基本です。既存の監視ツールはこの重要性を認識していますが、これまでのところ、トレースをI/Oメッセージの外部属性に限定しているため、メッセージ内の豊富な情報を見逃しています。
このフレームワークは、新しい類似性ベースのアプローチにより、アプリケーションからのネットワークおよびストレージ要求のフローを包括的にトレースし、相関させることができます。複数のトレースツールをサポートすることで、CaTはキャプチャしたイベントの範囲とアプリケーションのパフォーマンスへの影響のバランスをとることができます。
広く利用されている2つのアプリケーション(TensorFlowとApache Hadoop)を考慮して実施した実験評価では、CaTが分散システムの分析をいかに改善できるかを示しています。また、この結果は、トレース範囲とパフォーマンスへの影響のバランスを取るために使用できるトレードオフの例を示しています。興味深いことに、特定のケースでは、パフォーマンスとストレージのオーバーヘッドを無視して、イベントの完全なカバレッジを達成することができます。
[[2021__Middleware__CAT - content-aware tracing and analysis for distributed systems__translations]]