## Memo ## Memo with LLM ## Abstract 現代のクラウド・アプリケーションのグローバルなスケールと困難な要件は、複雑で広範囲に分散したサービス指向アプリケーションの開発につながっています。このようなアプリケーションを実現するものの1つがリモート・プロシージャ・コール(RPC)で、これは場所に依存しない通信を提供し、無数のクラウド通信の複雑さと要件をRPCスタック内に隠蔽します。したがって、RPCを理解することは、クラウド・アプリケーションの動作を理解するための1つの鍵となります。分散システムにおけるRPCの研究は数多く行われており、ソフトウェアとハードウェアの両方でRPCのオーバーヘッドを最適化する試みも行われていますが、最新のクラウド環境における「野生の」RPCの特性に関する知識はまだ不足しています。このギャップに対処するため、私たちの知る限り、RPCに関する初の大規模なフリート規模の研究を紹介します。この研究はGoogle社で実施され、Google検索、Gmail、Maps、YouTubeといったGoogleのユーザー向けWebサービスや、それらをサポートする情報・データ管理システムをサポートするインフラを測定しました。この調査を実施するために、10億以上のトレースからサンプリングされた10,000以上の異なるRPCメソッドと、約2年間にわたり30分ごとに収集された統計情報を調査しました。特に、データセンター内の RPC の量、スループット、成長率、RPC とそのコンポーネントの待ち時間(「RPC 待ち時間税」)、および RPC コール チェーンの構造を考慮しました。私たちの分析は、ハイパースケールにおける RPC の特性、範囲、複雑性が、先行研究の仮定とは大きく異なることを示しています。全体として、私たちの研究は、最大規模でのRPCの使用と特性に関する新たな洞察を提供し、この重要な通信メカニズムの多様な動作の最適化に関するさらなる研究の動機付けとなります。