Llama4 - yuuk1's Digital Garden

# Llama4 [[Meta]] の大規模言語モデル。[[NCCLX]] 集合通信フレームワークの評価対象ワークロードであり、訓練の各定常ステップのレイテンシを最大 12% 削減、96K 規模で起動を最大 11 倍高速化した。推論は Llama4 Maverick を用い、デコードレイテンシを 15〜80% 改善した。(Source: [[@2025__arXiv__Collective Communication for 100k+ GPUs]]) ## 関連 - ソース: [[@2025__arXiv__Collective Communication for 100k+ GPUs]] - エンティティ: [[NCCLX]] / [[Meta]]