# Aviral Kumar
[[Carnegie Mellon University]] に所属する研究者。LLM RL のサンプリング計算スケーリング則を研究する [[@2026__arXiv__IsoCompute Playbook - Optimally Scaling Sampling Compute for LLM Reinforcement Learning]] のシニア著者(著者リスト末尾)。オフライン RL(CQL)や価値ベース RL のスケーリング則(value-scaling.github.io; arXiv:2502.04327)、テスト時計算のスケーリング(arXiv:2408.03314、Snell らとの共著)など、RL のスケーリング研究を広く手がける。CMU AIRe lab のメンバー。
## 関連ソース
- [[@2026__arXiv__IsoCompute Playbook - Optimally Scaling Sampling Compute for LLM Reinforcement Learning]](シニア著者)
## 関連エンティティ
- [[Carnegie Mellon University]]
- [[Zhoujun Cheng]]