# Webロードバランシング
## 定義
ウェブロードバランシング(web load balancing)とは、ウェブリクエストを複数のサーバーに分散する機構の総称である。スケーラビリティ(負荷の増加への対応)・可用性(障害時の継続稼働)・管理性(サーバー間移行の容易化)・セキュリティ(DoS 攻撃の吸収)の 4 つを実現する手段として位置づけられる。対象は主に **ディスパッチャーベースのクラスタ(Cluster-based Web System)** ——仮想 IP(VIP)を持つフロントエンドが全リクエストを受けてバックエンドサーバー群に振り分ける構成——であり、DNS・CDN 等のグローバルスケールアウトは別領域で扱われる。(出典: [[@2011__World Wide Web__An up-to-date survey in web load balancing]])
主な分類軸は OSI 層と応答返路の 2 つ。
| 分類軸 | 選択肢 |
|---|---|
| OSI 層 | L2(MAC 書き換え)/ L3(IP 書き換え・トンネリング)/ L7(アプリケーション解析) |
| 応答返路 | 双方向(ロードバランサー経由)/ 一方向(サーバーからクライアントへ直送) |
| コンテンツ把握 | コンテンツ非依存(content-blind、L4 以下)/ コンテンツ依存(content-aware、L7) |
## 横断的知見
- まだ 1 ソース([[@2011__World Wide Web__An up-to-date survey in web load balancing]])のみ。複数ソース横断の知見は今後追加する。
## 未解決の問い
- **動的コンテンツのサービス時間予測**: CGI・データベースアクセスを含むリクエストの完了時間の見積もり困難性は 2010 年時点で未解決。現代の LLM 推論サービング([[@2025__ACM Computing Surveys__Towards Efficient Generative Large Language Model Serving]])での推論時間不均一性と同型の問題か?
- **負荷情報の陳腐化(staleness)**: 分散サーバーからの監視データが意思決定時に古い場合の対処(Dahlin 2000 が指摘)。現代のリアルタイムオブザーバビリティ([[オブザーバビリティ]]・[[テレメトリ]])でどこまで解決されたか?
- **HTTP/2・HTTP/3 への拡張**: HTTP/1.1 の持続接続問題(リクエスト粒度)は本論文で議論されるが、マルチプレクシングが標準化された HTTP/2・QUIC(HTTP/3)環境での同等問題は?
- **クラウド/マイクロサービス時代のロードバランシング**: Kubernetes の Service/Ingress・サービスメッシュ(Istio 等)は本論文のアーキテクチャをどう変化させたか?[[コンテナ配置最適化]]・[[マイクロサービスアーキテクチャ]] との接合点。
- **AI/LLM 推論特有の負荷不均一**: LLM 推論は出力トークン数が可変で入力長依存コストも大きく、従来のリクエスト均等分散では性能が出にくい。エネルギー効率も未解決課題(本論文§7)として残る。
## 関連
- [[@2011__World Wide Web__An up-to-date survey in web load balancing]] — 本概念の主要一次ソース
- [[コンテナ配置最適化]] — コンテナ間トラフィック観測に基づく配置最適化。ロードバランシングの後継問題としての位置づけ
- [[マイクロサービスアーキテクチャ]] — マイクロサービスにおけるサービス間負荷分散はウェブロードバランシングの進化形
- [[オブザーバビリティ]] — サーバー状態の監視情報取得はロードバランシングの動的方針に必須
- [[テレメトリ]] — サーバー負荷情報の陳腐化問題はリアルタイムテレメトリの課題と直結
## 出典
- [[@2011__World Wide Web__An up-to-date survey in web load balancing]] — Gilly・Juiz・Puigjaner、World Wide Web Vol.14 pp.105–131、2011、DOI:10.1007/s11280-010-0101-5