Webロードバランシング - yuuk1's Digital Garden

# Webロードバランシング ## 定義ウェブロードバランシング（web load balancing）とは、ウェブリクエストを複数のサーバーに分散する機構の総称である。スケーラビリティ（負荷の増加への対応）・可用性（障害時の継続稼働）・管理性（サーバー間移行の容易化）・セキュリティ（DoS 攻撃の吸収）の 4 つを実現する手段として位置づけられる。対象は主に **ディスパッチャーベースのクラスタ（Cluster-based Web System）** ——仮想 IP（VIP）を持つフロントエンドが全リクエストを受けてバックエンドサーバー群に振り分ける構成——であり、DNS・CDN 等のグローバルスケールアウトは別領域で扱われる。（出典: [[@2011__World Wide Web__An up-to-date survey in web load balancing]]）主な分類軸は OSI 層と応答返路の 2 つ。 | 分類軸 | 選択肢 | |---|---| | OSI 層 | L2（MAC 書き換え）/ L3（IP 書き換え・トンネリング）/ L7（アプリケーション解析） | | 応答返路 | 双方向（ロードバランサー経由）/ 一方向（サーバーからクライアントへ直送） | | コンテンツ把握 | コンテンツ非依存（content-blind、L4 以下）/ コンテンツ依存（content-aware、L7） | ## 横断的知見 - まだ 1 ソース（[[@2011__World Wide Web__An up-to-date survey in web load balancing]]）のみ。複数ソース横断の知見は今後追加する。 ## 未解決の問い - **動的コンテンツのサービス時間予測**: CGI・データベースアクセスを含むリクエストの完了時間の見積もり困難性は 2010 年時点で未解決。現代の LLM 推論サービング（[[@2025__ACM Computing Surveys__Towards Efficient Generative Large Language Model Serving]]）での推論時間不均一性と同型の問題か？ - **負荷情報の陳腐化（staleness）**: 分散サーバーからの監視データが意思決定時に古い場合の対処（Dahlin 2000 が指摘）。現代のリアルタイムオブザーバビリティ（[[オブザーバビリティ]]・[[テレメトリ]]）でどこまで解決されたか？ - **HTTP/2・HTTP/3 への拡張**: HTTP/1.1 の持続接続問題（リクエスト粒度）は本論文で議論されるが、マルチプレクシングが標準化された HTTP/2・QUIC（HTTP/3）環境での同等問題は？ - **クラウド/マイクロサービス時代のロードバランシング**: Kubernetes の Service/Ingress・サービスメッシュ（Istio 等）は本論文のアーキテクチャをどう変化させたか？[[コンテナ配置最適化]]・[[マイクロサービスアーキテクチャ]] との接合点。 - **AI/LLM 推論特有の負荷不均一**: LLM 推論は出力トークン数が可変で入力長依存コストも大きく、従来のリクエスト均等分散では性能が出にくい。エネルギー効率も未解決課題（本論文§7）として残る。 ## 関連 - [[@2011__World Wide Web__An up-to-date survey in web load balancing]] — 本概念の主要一次ソース - [[コンテナ配置最適化]] — コンテナ間トラフィック観測に基づく配置最適化。ロードバランシングの後継問題としての位置づけ - [[マイクロサービスアーキテクチャ]] — マイクロサービスにおけるサービス間負荷分散はウェブロードバランシングの進化形 - [[オブザーバビリティ]] — サーバー状態の監視情報取得はロードバランシングの動的方針に必須 - [[テレメトリ]] — サーバー負荷情報の陳腐化問題はリアルタイムテレメトリの課題と直結 ## 出典 - [[@2011__World Wide Web__An up-to-date survey in web load balancing]] — Gilly・Juiz・Puigjaner、World Wide Web Vol.14 pp.105–131、2011、DOI:10.1007/s11280-010-0101-5