[eBPF Japan Meetup #4 - connpass](https://ebpf.connpass.com/event/350944/) ## タイトル - eBPFを用いたAIネットワーク監視システム論文の実装 - [[2024__SIGCOMM__R-Pingmesh - A Service-Aware RoCE Network Monitoring and Diagnostic System]] - [[2015__SIGCOMM__Pingmesh - A Large-Scale System for Data Center Network Latency Measurement and Analysis]] - [[R-Pingmesh実装の設計]] ## アウトライン - 伝えたいこと - 論文は実装できる。 - はじめに (5分) - AIインフラ - 大規模なAIの進歩 - AIネットワークの要件 - 問題意識 - - R-pingmesh論文の紹介 (3分) - R-pingmeshの実装 - システム構成 - - 実装のハマりどころ - RoCEのフルメッシュprobe通信 - - AIコーディング - 積み残し - まとめ - ## スライド [eBPFを用いたAIネットワーク監視システム論文の実装 / eBPF Japan Meetup #4 - Speaker Deck](https://speakerdeck.com/yuukit/ebpf-japan-meetup-number-4)