## Memo
## Memo with LLM
## Abstract
本論文では、[[OpenTelemetry]]の[[Distributed Tracing|分散トレーシング]]のオーバーヘッドを、異なるサンプリング戦略を用いて、クラウド環境で調査する。分散トレーシングはテレメトリデータであり、開発者が時間的情報を用いてシステム内の原因事象を分析することを可能にする。これは、テレメトリーデータが生成され、トレースを処理するコレクターを通して送信され、最終的にバックエンドに送信されるため、CPU、メモリー、ネットワーク使用量というオーバーヘッドを伴う。3つの異なるサンプリング戦略、ヘッドサンプリングとテールベースサンプリング、そしてこれら2つの混合を用いてサンプリングを行うことで、いくつかの情報を失う代償としてオーバーヘッドを削減することができる。この情報損失がアプリケーションのパフォーマンスにどのような影響を与えるかを測定するために、トレースに合成エラーメッセージを導入し、サンプリング戦略によって検出できるエラーのトレース数を測定するために使用する。[[Kubernetes]]のノード間で送信されるデータが多いサービスと少ないサービスについて、3つのサンプリング戦略すべてを比較した。実験は2ノードと4ノードのセットアップでもテストされた。本論文はNasdaqと共同で実施された。Nasdaqは高性能な監視ツールを持つことに関心があり、彼らのシステムを分析し、関連性をエミュレートした。その結果、テール・ベースのサンプリングは、ヘッド・ベースのサンプリングと比較して、すべてのエラーを捕捉するメリットがあるにもかかわらず、オーバーヘッドが最も大きかった(CPU平均71.33%、メモリ平均23.7%、ネットワーク平均5.6%)。ヘッド・ベースのサンプリングは、トレースのバックエンドとして[[Jaeger]]をデプロイしたノードを除いて、オーバーヘッドが最も少なく、ミックス・サンプリングと比較して、より高い総サンプリング・レートが4ノードのセットアップで平均12.75%のCPUオーバーヘッドを追加した。しかし、混合サンプリングはより多くのエラーを捕捉した。実験に要した時間全体を測定すると、ノード間でより多くのリクエストを送信しなければならなかった場合に、最も大きな影響が観察された。