@2017__arXiv__A Survey of Distributed Message Broker Queues

> [!abstract] 概要(arXiv abstract の日本語訳) > 本論文は、分散通信のために現在広く用いられているメッセージブローカをサーベイする。これらの主たる目的は、単一障害点を持たない非集権トポロジの構築を促進し、耐障害性と高可用性を実現することにある。この特性が分散アーキテクチャでの利用に最適である理由となる。しかし、これを実現するために構築された複数のプロトコルが存在し、現実世界での適用可能性を判断するためにそれらの機能・性能の経験的比較を持つことは有益である。本論文は二つの広く使われるプロトコル(Kafka と AMQP)に焦点を当て、それらの機能の発散点と、多様なテストワークロード下での性能を探究する。 ## 論文情報 - タイトル: A Survey of Distributed Message Broker Queues - 著者: [[Vineet John]]([[University of Waterloo]])、[[Xia Liu]]([[University of Waterloo]]) - 媒体: arXiv preprint - arXiv ID: 1704.00411v1 [cs.DC] 3 Apr 2017 - ページ数: 8 ページ - 謝辞: Dr. Samer Al-Kiswany([[University of Waterloo]])の指導 ## 概要分散メッセージブローカ全般を概観しつつ、対照的な設計思想を持つ 2 プロトコル[[Apache Kafka]](高スループット指向、LinkedIn でのログ処理用途で誕生)と[[AMQP]](高信頼性指向、金融取引用途で誕生)を、Flotilla ベンチマークツールで 5 ノード・最大 1M メッセージ規模で比較する。さらに付録で ActiveMQ・ZeroMQ・[[RabbitMQ]]・Apache Qpid・Amazon SQS・MSMQ の 6 実装を高水準で要約する。Kafka はスループットで優位、AMQP はレイテンシと信頼性で優位、という結論に至る。 ## 問題設定 - **RQ0**: 現在広く用いられている message broker 実装は何か。 - **RQ1**: メッセージキュー実装に共通する要件は何か。 - **RQ2**: 現行 message queue offering の発散する機能は何か。 - **RQ3**: 各実装はどのように信頼性・パーティショニング・耐障害性を提供するか。 ## 提案手法本論文は新規システムの提案ではなく**プロトコル比較サーベイ + 経験的ベンチマーク**である。 - **Kafka アーキテクチャ(§3, Figure 1)**: データを topic に分割、topic をさらに partition に分割し各 broker は 1 つ以上の partition を保持。producer が topic に publish、broker がメッセージを格納、consumer は iterator で消費。consumer は pull モデルで自分のペースで読む。subscription は (a) point-to-point(任意の consumer が単一コピーを読む)と (b) pub-sub(各 consumer が自分のコピーを持つ)の 2 種。 - **Kafka ストレージ(§B)**: 各 topic は論理ログ、物理的には partition の segment 列。segment はほぼ同サイズで切り出される。メッセージ ID は使わず**論理オフセット**で識別。broker レベルキャッシュなしで OS ページキャッシュに完全依存(write-through + read-ahead)。consumer の遅延が小さい限り大半のメッセージはキャッシュから供給される。 - **Kafka 協調(§B.2)**: consumer group が論理的に 1 consumer として動き、partition がパラレリズムの最小単位。partitionCount > consumerCount を典型とし、leader/master ノード概念を持たない。Zookeeper を合意サービスとして利用し、Broker/Consumer/Ownership/Offset の 4 種レジストリで状態管理。consumer は Zookeeper watcher で broker/consumer 変更を検知して再バランス(partition を均等再割当 + 直近 offset から再開)。 - **Kafka 配送保証(§B.3)**: at-least-once 配送。exactly-once は 2PC が必要で「やりすぎ」と判断、デデュプは応用層に委ねる。partition 内は単調増加オフセットにより順序配送保証。メッセージ単位の CRC で破損検出。 - **AMQP アーキテクチャ(§4, §C.1, Figure 2)**: producer は queue に直接送らず exchange に送る。exchange は binding key が routing key と一致する queue にメッセージを送る。これにより producer と consumer の双方が状態を持たずに済み、ルーティング変更は exchange 側で完結。コンポーネントは Broker/Producer/Consumer/Exchange/Queue/Virtual host/Binding/Routing key。 - **AMQP 4 種 exchange(§C.2)**: - **direct**: routing key に応じて異なる queue へ送信。consumer 間でロードバランス。 - **topic**: routing key に binding key がマッチする全 queue に送信(pub-sub 実装)。 - **fanout**: routing key を無視して全 binding queue に送信(ブロードキャスト)。 - **header**: routing key でなくメッセージヘッダで queue を選ぶ。 - **AMQP 耐障害性(§C.3)**: queue ごとの durable フラグで永続化を制御。delivery mode = 2 で persistent メッセージは broker 再起動後に復元。distributed broker は cluster / federation / shovel の 3 方式で HA・WAN 越え。 **Figure 2: 図** ![[_attachments/arxiv-1704.00411/fig2-figure.png]] (Figure 2. AMQP Workﬂow を示す。) **Figure 11: アーキテクチャ** ![[_attachments/arxiv-1704.00411/fig11-architecture.png]] (Figure 11. ZeroMQ Architecture に関するアーキテクチャを示す。) **Figure 1: アーキテクチャ** ![[_attachments/arxiv-1704.00411/fig1-architecture.png]] (Figure 1. Kafka Architecture に関するアーキテクチャを示す。) ## 新規性本論文の貢献は**設計思想の対照軸抽出 + 実証ベンチマーク**にあり、新規アルゴリズムは提案しない。先行研究(Banavar 1999 の MOM ケース論文・Kreps NetDB 2011 の Kafka 紹介・Vinoski 2006 の AMQP 解説)が個別プロトコルを論じるのに対し、本論文は Kafka と AMQP を同一ベンチ環境(Flotilla による 5 ノード共通テストベッド)で直接対比し、スループット vs レイテンシ・損失許容 vs 配送保証という設計選択軸を経験的に示す。 ## 実験設定 - **テストベッド**: 5 ノード、各ノードは 12 コア @2300.13MHz・16GB メモリ・HDD 永続ストレージ・1Gbps ネットワーク。 - **比較対象**: Kafka と RabbitMQ(AMQP の代表実装)。 - **ベンチマーク**: Flotilla(Go 製 message broker ベンチ、`https://github.com/v1n337/flotilla`、改造版)。 - **シナリオ 2 種**: - **Single producer/consumer**: 全体ワークロード一定(1M メッセージ・各 50B)、queue デプロイを 1〜5 ノードでスケール。 - **Multiple producer/consumer**: ノード数固定でノード当たり producer/consumer 数をスケール。 ## 実験結果 - **Kafka single P/C スケールアウト(Fig.3, Fig.5)**: payload 一定でノード追加すると **レイテンシ約 3 倍改善・スループット 1.06 倍低下**(ほぼ維持)。大規模ログ集約ワークロードでのクラスタ展開の有効性を示す。 - **Kafka multi P/C 同一ノード(Fig.4, Fig.6)**: producer/consumer を 5 倍に増やすと **レイテンシが約 2 桁(100 倍)悪化、consumer スループット 29 倍低下**。これは partition 内にメッセージが滞留することに対応。原因は Zookeeper(メタデータ層)が単一ノード上で競合の焦点となり context switching が増えるため、と論文は説明。 - **RabbitMQ single P/C(Fig.7)**: ノード当たり 1 producer/consumer で**安定したスループット**(producer ≈ consumer)。exchange のルーティング速度が producer よりも速く、consumer は producer がボトルネックとなる(producer スループットが consumer の天井)。 - **RabbitMQ multi P/C(Fig.8, Fig.9)**: producer/consumer を増やすと **スループット低下**。Kafka と同じく資源競合が原因。レイテンシは producer 15 まで上げると exchange がメッセージトラフィックで飽和し queue にメッセージが滞留 → レイテンシ急増。 - **総合比較(§6)**: Kafka のスループット優位は (1) SendFile API でカーネルバッファをバイパス・(2) シーケンシャルディスク書き込みとページキャッシュ・(3) 標準バッチングの 3 つ。AMQP のレイテンシ優位は (1) push モデル(Kafka は pull モデル)・(2) 既定で broker 側でディスク永続化しない(Kafka は永続化)の 2 つ。 - **Feature 比較表(Table 1, §A)**: - Message Format: Kafka = Bytes(開発しやすい) / AMQP = Binary(圧縮効率・スループット向上) - Message Routing: Kafka = 仲介者なし、broker 直送 / AMQP = exchange + binding で仲介 - Reliability: Kafka = 非信頼(送信者は ACK を受けない) / AMQP = 信頼(受信時 ACK) - Batching: Kafka = 標準で利用可能 / AMQP = 実装困難 - Virtual Host: Kafka = なし / AMQP = クライアント分離に使用 - Basic Distributed Unit: Kafka = Topic / AMQP = Queue - Delivery Model: Kafka = pull のみ / AMQP = push と pull 両方 - Subscription Model: Kafka = P2P と pub-sub / AMQP = exchange 種別に応じて両方 - Persistence: Kafka = ページキャッシュ経由で永続ファイルシステムログに書き込み / AMQP = queue 作成時設定 - Application Domain: Kafka = ログ集約・ビッグデータ(高スループット・低耐久性) / AMQP = 金融・株式・銀行(強耐久性) **Figure 4: 性能評価** ![[_attachments/arxiv-1704.00411/fig4-performance.png]] (Figure 4. 性能評価の結果を示す。) **Figure 3: 性能評価** ![[_attachments/arxiv-1704.00411/fig3-performance.png]] (Figure 3. 性能評価の結果を示す。) ## 考察 - **メッセージブローカ選定の 2 軸**: スループットと信頼性。アプリケーションが信頼性非要求ならば Kafka が優位(ページビュー・広告クリック・SNS リアクション等の損失許容シナリオ)。メッセージ自体が重要(金融取引等)ならば AMQP を推奨(損失コストが最適スループット未達コストより高い場合)。 - **AMQP の追加価値**: 標準で暗号化、4 種 exchange による peer-to-peer/pub-sub/broadcast 切替で IM や通知サービスにも適合。 - **発散点の根本要因**: 起源が違う(LinkedIn のログ処理 vs 金融取引処理)ため設計思想が真逆。Kafka は「信頼性をスループットでトレードオフ」(ログ集約データなら配送保証不要)、AMQP は「信頼性を絶対優先」(取引データなら 1 件損失も許されない)。 - **付録の他実装**: ActiveMQ(JMS 上、Stomp/AMQP/MQTT 等多プロトコル対応、federated cluster 可)、ZeroMQ(broker-less、"smart endpoint, dumb network"、株式取引メッセージ用に中央 broker 回避)、RabbitMQ(VMware・Erlang 製、AMQP の人気実装、Mozilla/AT&T/UIDAI 採用)、Qpid(AMQP、Java/C++ 版、Corosync で HA)、Amazon SQS(標準キューが at-least-once + best-effort 順序、FIFO は US West/East のみ)、MSMQ(Microsoft の保証配送キュー)。 ## 強み / 弱点・課題 - **強み**: 同一テストベッド(5 ノード、共通 Flotilla ツール)での直接対比という単純明快な構造。Feature 表で「ログ集約か金融取引か」という応用領域選択基準まで一文で答える。Zookeeper コーディネーションや 4 種 exchange のような実装機構を簡潔に整理。 - **弱点・課題**: - **ベンチマーク規模が小さい**: 5 ノード・1Gbps・HDD・1M メッセージ × 50B という 2017 年時点の標準的構成で、現代の Kafka 運用(SSD・10/40Gbps・複数 TB/日)とは規模が違う。本サーベイの結論を 2026 年運用に直接適用するには再評価が必要。 - **Kafka multi P/C のレイテンシ 100 倍悪化の原因分析が浅い**: Zookeeper がボトルネックと示唆するが定量的な裏付け(プロファイリング等)はない。現在の Kafka は Zookeeper を捨て KRaft(Kafka Raft)に移行中で、本サーベイの含意は古い。 - **設計思想の二分法が単純化されすぎ**: Kafka も idempotent producer・transactional writes・exactly-once semantics(Kafka 0.11 以降)で AMQP 的な保証を提供できるようになり、AMQP も RabbitMQ の Streams で Kafka 的なログ集約に対応中。本サーベイ後の収束を捕捉しない。 - **論文の研究貢献は薄い**: 単一ベンチ環境での比較と Feature 表だけで、新規アルゴリズム・新規分類軸・新規発見はない。学術論文というより技術レポート/コース成果物の色が濃い(University of Waterloo の Dr. Samer Al-Kiswany 指導のプロジェクト謝辞から推測)。 - **本 wiki 視点での補足**: 2017 年時点の Kafka・AMQP・RabbitMQ の素朴な初期理解として有用だが、KRaft 移行・Kafka Streams・RabbitMQ Streams・Pulsar(Yahoo!)・Redpanda 等の後継・派生は完全に未取込。 ## 関連 - 概念: [[分散メッセージブローカ]] - 製品: [[Apache Kafka]]、[[AMQP]]、[[RabbitMQ]] - 著者: [[Vineet John]]、[[Xia Liu]] - 組織: [[University of Waterloo]]