# オープンネットワーキング ## 定義 オープンネットワーキング(open, disaggregated networking)は、network operating system(NOS)を switching ASIC から切り離し、vendor-neutral な部品を community 主導で組み上げることで data center fabric を構成する設計思想。Switch Abstraction Interface(SAI)の OCP 採用以降、hardware–software 分離が進み、[[SONiC]] のような NOS が多様な ASIC を統一制御する。これは vendor lock-in を緩和し、参入障壁を下げ、hardware と software を独立に進化させる。([[2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]] §2) AI/HPC fabric では、RoCEv2(RDMA over Converged Ethernet)が要求する lossless Ethernet——PFC(Priority Flow Control)と ECN(Explicit Congestion Notification)——を SONiC が提供し、EVPN/VXLAN による scalable overlay と合わせて、proprietary な InfiniBand に代わる production-grade な選択肢となる。 ## 横断的知見 - (2 ソース目以降で育てる。現時点は単一ソース。) ## 未解決の問い - オープン Ethernet fabric(SONiC/RoCEv2)は InfiniBand 級の collective 性能を出せるが、[[2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]] §8.1 は「firmware/kernel/RDMA stack の版整合と、ECN 閾値・PFC・NCCL channel striping の精緻な調整」という deep cross-layer の専門知を代償に要すると述べる。この調整コストは [[2024__NSDI__MegaScale - Scaling Large Language Model Training to More Than 10,000 GPUs]] の自社 datacenter network チューニングや [[2026__Vicinagearth__Efficient Training of Large Language Models on Distributed Infrastructures - A Survey]] の通信最適化と比べてどれだけ大きいか。open 化の TCO 優位はこの運用負荷を吸収できるか。 - RoCEv2 の congestion control は DCQCN(Zhu 2015)を基盤とするが、SAKURAONE は ECN max marking probability を 1% と保守的に設定し PFC 依存を許容した(§8.2、Table 15)。この「PFC 寄り」設定はワークロード特性でどう変えるべきか。ECN 主体に振った場合の throughput への影響は。 - ECN marking rate / PFC pause counter を実運用で継続収集し、観測帯域を congestion に帰属できるようにするには、どの telemetry を [[テレメトリ]] 層に統合すべきか(SAKURAONE は観測期間中これらを未収集 §7.2)。 ## 関連 - ソース: [[2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]] - エンティティ: [[SONiC]] / [[SAKURAONE]] / [[SAKURA Internet]] - 概念: [[LLM分散学習]] / [[GPUクラスタ運用]] / [[並列化戦略]](通信局所性 rail-optimized topology の前提) - 関連 MOC: [[Network - MOC]] / [[HPC - MOC]] ## 出典 - [[2026__MLSys2026__SAKURAONE - An Open Ethernet-Based AI HPC System]](§2 Background, §3 Motivation, §4.2 Interconnect Requirements, §8.1 System Implications, §8.2 RoCE Congestion-Control Tuning)