# Ultra Ethernet
## 定義
Ultra Ethernet(UE)は、Ultra Ethernet Consortium(UEC)が 2025 年に公開した AI/HPC 向け高性能 Ethernet 標準(UE 1.0 仕様、562 ページ)である。AMD・Broadcom・HPE・Intel・Microsoft・Cisco・Meta・Arista らが 2022 年に設立し、Linux Foundation の Joint Development Foundation プロジェクトとして 2024 年末時点で 100 超の加盟企業・1,500 超の参加者を擁する。中心的な貢献は Ultra Ethernet Transport(UET)という新しいトランスポートプロトコルであり、完全ハードウェアオフロードが可能なコネクションレス設計を持つ。(Source: [[@2025__arXiv__Ultra Ethernet's Design Principles and Architectural Innovations]])
UET の主要設計方針:
1. **コネクションレス・コネクションレス**: Packet Delivery Context(PDC)をエフェメラルに管理。JobID+PIDonFEP+Resource Index でアドレスを解決し、キューペアの概念を排除する
2. **パケット単位スプレー**: エントロピー値(EV)を変更することで ECMP の複数パスにパケットを分散。トラフィック偏極を防止する
3. **有損失ネットワーク対応**: PFC を必須としない。パケットトリミング・EV ベース損失検知・OOO カウンタなどの高速損失検知機構を提供
4. **選択的確認応答**: SACK ビットマップと累積確認応答(CACK)を組み合わせ、アウトオブオーダー配送を効率的に処理
5. **ゼロ RTT 接続確立**: PDC は最初のパケット到着で受信側が生成。最初のパケットから全速で送信を継続できる
6. **統合セキュリティ**: TSS サブレイヤが AES-GCM-256 によるエンドツーエンド認証・暗号化をゼロトラストモデルで提供
## 横断的知見
- **UE は RoCEv2 の 3 大設計欠陥への正面からの回答である**: [[@2023__IEEE Computer__Datacenter Ethernet and RDMA - Issues at Hyperscale]] が指摘した 8 つの RoCE 設計問題のうち、特に深刻な(1) PFC ヘッドルームバッファ肥大、(2)Go-back-N 再送、(3)経路固定という 3 つに UE は直接回答する。有損失ネットワーク対応・SACK・パケットスプレーはそれぞれの対策である。同論文の著者らが UE 1.0 の共著者でもあり、問題提起から標準化まで同じグループが主導した。(Source: [[@2025__arXiv__Ultra Ethernet's Design Principles and Architectural Innovations]], [[@2023__IEEE Computer__Datacenter Ethernet and RDMA - Issues at Hyperscale]])
- **UE・Falcon v1.1・MRC は独立に RoCEv2 の同じ弱点を解く**: [[@2026__SONiC Workshop Japan 2026__SONiC Scale-Up Working Group から探る Scale-Up や Ultra Ethernet 機能の実装方法]] の比較表(12 軸)は、UE Transport・Falcon v1.1・MRC(Multipath RC)の 3 方式がいずれもパケットロス許容・SACK・パケット粒度マルチパスを採用し、RoCEv2 のみが逸脱することを明示した。三方式は互いに独立して設計されたが同一解を選んでいる点は、「次世代 Ethernet ではパケットスプレー+SACK が必然の設計」という産業コンセンサスを示唆する。(Source: [[@2026__SONiC Workshop Japan 2026__SONiC Scale-Up Working Group から探る Scale-Up や Ultra Ethernet 機能の実装方法]], [[@2025__arXiv__Ultra Ethernet's Design Principles and Architectural Innovations]])
- **「計算 1,000 倍 vs 帯域 100 倍」の非対称が設計の前提を変えた**: UE の論文は、Moore の法則により 25 年間でトランジスタコストが 100,000 分の 1 になった一方で帯域は 100 倍しか伸びていないことを明示し、「計算コストのかかる」パケットスプレー・選択的確認応答・ゼロ RTT のような機構がシリコンで合理的に実装できる新時代を宣言する。この「ビットあたりの計算が 1,000 倍使えるようになった」という前提が InfiniBand 設計との根本的な断絶である。(Source: [[@2025__arXiv__Ultra Ethernet's Design Principles and Architectural Innovations]])
- **SONiC/SAI が UE spec v1.0.2 に基づき LLR・CBFC・LLDP を実装中**: リンク層機能(LLR、CBFC)は Ethernet 互換の拡張として定義されており、LLDP を通じてネゴシエートされる。[[@2026__SONiC Workshop Japan 2026__SONiC Scale-Up Working Group から探る Scale-Up や Ultra Ethernet 機能の実装方法]] は SONiC Scale-Up Working Group がこれらをオープンソースで実装中であることを報告した。ただしトランスポート層(UET 本体)は UEC 1.0 に含まれない別仕様である。(Source: [[@2026__SONiC Workshop Japan 2026__SONiC Scale-Up Working Group から探る Scale-Up や Ultra Ethernet 機能の実装方法]])
## 未解決の問い
- UE のロードバランシング(REPS、ビットマップ方式等)の最善策は何か。論文は「研究課題」と明記しており、複数スキームの混在が非自明な相互作用を生む可能性がある
- RCCC はアウトキャストシナリオで帯域を取り残す。NSCC との併用推奨だが、2 アルゴリズム同時動作の収束速度・安定性の定量評価はどうなるか
- 第 1 世代製品が出揃ったとき、UE・Falcon v1.1・MRC のどれが AI クラスタの主流になるか。相互運用性と多ベンダー採用の実態はどうなるか
- UE のフロントエンドネットワーク統合(バックエンド+フロントエンドの単一物理インスタンス化)は将来版で明示的に対象化される予定だが、テナント分離・セキュリティへの影響はどうなるか
- UE 1.0 仕様は 562 ページに達し「複数ラウンドのエラータ修正」を著者が予告している。標準実装が本格展開される段階でどのような実運用上の問題が顕在化するか
## 関連
- 概念: [[RDMA]] / [[RoCE設計課題]] / [[オープンネットワーキング]] / [[集合通信]] / [[HPCインターコネクトベンチマーク]]
- エンティティ: [[Torsten Hoefler]] / [[Broadcom]] / [[Hewlett Packard Enterprise]] / [[OpenAI]] / [[Intel Corporation]] / [[Microsoft]] / [[AMD]]
- ソース: [[@2025__arXiv__Ultra Ethernet's Design Principles and Architectural Innovations]] / [[@2023__IEEE Computer__Datacenter Ethernet and RDMA - Issues at Hyperscale]] / [[@2026__SONiC Workshop Japan 2026__SONiC Scale-Up Working Group から探る Scale-Up や Ultra Ethernet 機能の実装方法]]
- MOC: [[structures/分散深層学習 - MOC]]
## 出典
- [[@2025__arXiv__Ultra Ethernet's Design Principles and Architectural Innovations]] — UE 1.0 の設計解説論文(主出典)
- [[@2026__SONiC Workshop Japan 2026__SONiC Scale-Up Working Group から探る Scale-Up や Ultra Ethernet 機能の実装方法]] — SONiC での UE 実装状況と RoCEv2/UE/Falcon/MRC の 12 軸比較
- [[@2023__IEEE Computer__Datacenter Ethernet and RDMA - Issues at Hyperscale]] — RoCEv2 の設計課題を体系化した論文(UE の動機づけ)