# BlueField-3 NVIDIA のプログラマブルな SmartNIC / DPU(SuperNIC)。組み込みマイクロプロセッサ(DPA: Data-Path Accelerator、RISC アーキテクチャ・Run-To-Complete 実行)と大容量メモリ(BlueField-3 で 1GB DPA-accessible DDR)を持ち、パケット処理パイプライン近傍で NIC 上のイベント(パケット送信・NACK 受信等)にアクセスできる。(Source: [[2026__ASPLOS__Pulse - Fine-grained and Non-intrusive LLM Training Monitoring via Microsecond-level Traffic Measurement]], §4.1) [[Pulse]] はこのプログラマビリティを計測プラットフォームとして用い、NIC Agent の 3 層計測のうち計測層を DPA 上に、集約層をパケットパイプライン上(DOCA PCC library で NIC 上のイベントにアクセス)に実装する(DOCA 2.9.0)。ConnectX-6 Dx と並ぶ主流の RNIC として、ホストベース/P4 switch ベースが達成できないフル精度のマイクロ秒・QP 単位の RDMA 計測を可能にする。Pulse のテストベッドでは各マシンに 8 基搭載され 400Gbps RoCEv2 で接続。同種の SmartNIC(AMD Pensando 等)への一般化も論じられる(§9)。 ## 関連 - ソース: [[2026__ASPLOS__Pulse - Fine-grained and Non-intrusive LLM Training Monitoring via Microsecond-level Traffic Measurement]] - 概念: [[LLM学習モニタリング]] / [[GPUクラスタ運用]] - エンティティ: [[Pulse]] / [[NCCL]]