## Memo
- [Alibabaの巨大なマイクロサービスアーキテクチャで設計されたシステムを分析した論文を読んだ – koyama's blog](https://blog.koyama.me/2024/06/09/alibaba-microservices/)
- [x.com](https://twitter.com/yuuk1t/status/1800080801918599441)
> For instance, an analysis of the Alibaba traces reveals that 90% of the spans provide no useful information, with only 10% of spans being essential for performance diagnosis [10].
> [[[2024__IC2E__Unleashing Performance Insights with Online Probabilistic Tracing]]]
## Memo with LLM
## Abstract
コンテナで動作する疎結合で軽量なマイクロサービスは、モノリシックなアプリケーションに徐々に取って代わりつつある。マイクロサービスの特徴を理解することは、マイクロサービス・アーキテクチャをうまく活用するために非常に重要である。しかし、本番環境におけるマイクロサービスとその関連システムに関する包括的な研究は、今のところ行われていない。本論文では、Alibabaクラスタにおけるマイクロサービスの大規模デプロイメントに関する確かな分析を紹介する。我々の研究は、マイクロサービスの依存性と実行時のパフォーマンスの特徴付けに焦点を当てている。マイクロサービスのコールグラフを詳細に分析し、従来のデータ並列ジョブのDAGとの違いを定量化する。特に、マイクロサービス呼び出しグラフはヘビーテール分散しており、そのトポロジーはツリーに似ていること、さらに、多くのマイクロサービスがホットスポットであることを観察する。我々は、マイクロサービス設計を最適化するために利用できる3つのタイプの意味のある呼び出し依存性を明らかにする。マイクロサービスのランタイムパフォーマンスに関する調査から、ほとんどのマイクロサービスはメモリ干渉よりもCPU干渉の影響を受けやすいことがわかった。より代表的なマイクロサービスのトレースを合成するために、コールグラフをシミュレートする数学モデルを構築した。実験結果は、我々のモデルがAlibabaのトレースから観察されたグラフの特性をよく保持できることを示している。