Aviral Kumar - yuuk1's Digital Garden

# Aviral Kumar [[Carnegie Mellon University]] に所属する研究者。LLM RL のサンプリング計算スケーリング則を研究する [[@2026__arXiv__IsoCompute Playbook - Optimally Scaling Sampling Compute for LLM Reinforcement Learning]] のシニア著者（著者リスト末尾）。オフライン RL（CQL）や価値ベース RL のスケーリング則（value-scaling.github.io; arXiv:2502.04327）、テスト時計算のスケーリング（arXiv:2408.03314、Snell らとの共著）など、RL のスケーリング研究を広く手がける。CMU AIRe lab のメンバー。 ## 関連ソース - [[@2026__arXiv__IsoCompute Playbook - Optimally Scaling Sampling Compute for LLM Reinforcement Learning]]（シニア著者） ## 関連エンティティ - [[Carnegie Mellon University]] - [[Zhoujun Cheng]]