# SRv6 ## 定義 SRv6(Segment Routing over IPv6)は、パケット自体に完全な経路情報を埋め込むソースルーティング技術である。IPv6 拡張ヘッダに Segment List(経由すべきノードの順序付きリスト)を格納し、スイッチは動的な経路計算を行わず単純に Segment に従い転送する。AI スーパーコンピュータネットワーキングでは [[MRC]] および [[マルチプレーンClosトポロジ]] と組み合わせて、決定的転送と瞬時の障害回避を実現する。(Source: [[@2026__LinkedIn__Resilient AI Supercomputer Networking - How MRC and SRv6 Keep 100,000+ GPUs Training]]) 主要特性: - **決定的転送**: 経路が送信元で事前決定済みのため予測可能な遅延 - **瞬時障害回避**: 障害パスを新パケットから即座に迂回できる(再ルーティング収束待ち不要) - **動的再計算不要**: OSPF/BGP の収束時間に依存せず、スイッチの状態機械を単純化 ## 横断的知見 現時点では単一ソースのみ。2 ソース目以降に横断的知見を積み増す。 - SRv6 の「送信元が経路を決める」アーキテクチャは、従来の分散型ルーティングプロトコル(OSPF/BGP)の収束遅延問題を根本的に回避する。AI 訓練クラスタのような均質なワークロードでは、経路決定を集中管理できるため SRv6 との相性がよい。(Source: [[@2026__LinkedIn__Resilient AI Supercomputer Networking - How MRC and SRv6 Keep 100,000+ GPUs Training]]) - [[マルチプレーンClosトポロジ]] の各プレーンを SRv6 で識別することで、障害プレーンのトラフィックを正常プレーンへ即時切り替えできる可能性がある。プレーン選択ロジックと SRv6 セグメントの対応関係は未確認。(Source: [[@2026__LinkedIn__Resilient AI Supercomputer Networking - How MRC and SRv6 Keep 100,000+ GPUs Training]]) ## 未解決の問い - AI 訓練クラスタで SRv6 の経路情報(Segment List)はどこで計算・配布されるか。コントローラベースの集中管理か、それとも送信ホスト自身が計算するか。 - SRv6 ヘッダのオーバーヘッド(IPv6 拡張ヘッダ追加)は 10 万 GPU 規模でどの程度の帯域影響があるか。 - SRv6 と [[MRC]] のパケットスプレーは、同一パケットの複数コピーへの経路付けをどう整合させるか。 - Ethernet/RoCEv2 ネットワークで SRv6 を採用する場合、IP レイヤと RDMA レイヤの境界設計はどうなるか。 ## 関連 - 概念: [[MRC]] / [[マルチプレーンClosトポロジ]] / [[RDMA]] / [[LLM分散学習]] - ソース: [[@2026__LinkedIn__Resilient AI Supercomputer Networking - How MRC and SRv6 Keep 100,000+ GPUs Training]] ## 出典 - [[@2026__LinkedIn__Resilient AI Supercomputer Networking - How MRC and SRv6 Keep 100,000+ GPUs Training]]