# Llama4
[[Meta]] の大規模言語モデル。[[NCCLX]] 集合通信フレームワークの評価対象ワークロードであり、訓練の各定常ステップのレイテンシを最大 12% 削減、96K 規模で起動を最大 11 倍高速化した。推論は Llama4 Maverick を用い、デコードレイテンシを 15〜80% 改善した。(Source: [[@2025__arXiv__Collective Communication for 100k+ GPUs]])
## 関連
- ソース: [[@2025__arXiv__Collective Communication for 100k+ GPUs]]
- エンティティ: [[NCCLX]] / [[Meta]]