# NVIDIA
GPU・AI アクセラレータ・AI インフラの最大手企業。H100/H200 等の GPU、[[NCCL]] 等の集団通信ライブラリ、[[Megatron-LM]] 等の訓練フレームワーク、[[TensorRT-LLM]]/[[NVIDIA NIM]] 等の推論スタック、[[NIXL]] 等のデータ転送ライブラリ、[[BlueField-3]] 等の SmartNIC/DPU を開発し、LLM の訓練から推論までのフルスタックを支える。[[GenAI-Perf]] で推論ベンチマーク標準化にも取り組む。
Scaling Up RL 論文では、1.5B パラメータモデルに対する長期 RL 訓練の体系的調査を行い、[[Nemotron-Research-Reasoning-Qwen-1.5B]] を公開した。
[[Nemotron 3]] ホワイトペーパーでは、ハイブリッド Mamba–Transformer MoE アーキテクチャと [[LatentMoE]]・NVFP4 事前学習・マルチ環境同時 RL を組み合わせた Nano/Super/Ultra の 3 モデルファミリーを発表した。ポストトレーニングソフトウェアスタック [[NeMo-RL]]・NeMo-Gym を Apache 2.0 で公開する。