## Memo ## Memo with LLM ## Abstract 分散トレーシングは、分散システム内の様々なコンポーネントやサービス間を移動するリクエストを追跡し可視化することで、アプリケーションを監視するために使用される手法です。主要なクラウドコンピューティングアプリケーションで広く採用されているにもかかわらず、我々の知る限り、分散共有メモリ(DSM)エミュレーションでは分散トレースは採用されていません。このようなエミュレーションでは、通常、ネットワークに接続されたノード(サーバ)のセットがメモリデータのコピーを保持し、クライアント(リーダ/ライタ)のセットはサーバにメッセージを送信することでデータにアクセスします。この環境における主な課題は、非同期性や障害にもかかわらずデータの一貫性を維持することである。従来、DSM実装における操作の待ち時間は、高レベルの性能分析を提供する単純なログベースの戦略によって評価されてきた。 本論文では、DSMに分散トレースを導入し、きめ細かな性能解析を行うことで、性能のボトルネックを特定することを試みる。この点に関して、Aresをケーススタディとして使用する。Aresはクラッシュに強いDSMアルゴリズムであり、アトミックな一貫性を提供し、ネットワーク化されたノードの動的な参加をサポートする。我々のアプローチは、一連のトレースツールを採用している:コードインスツルメンテーションのための[[OpenTelemetry]]、テレメトリーデータ収集のための[[Jaeger]]、可視化のための[[Grafana]]です。