# UT Austin University of Texas at Austin。米国テキサス州オースティンの州立研究大学。ScaleRL 論文では [[Devvrit Khatri]]、Sai Surya Duvvuri、[[Inderjit S. Dhillon]] が所属し、Meta との共同研究として 400,000 GPU 時間超の RL スケーリング研究を実施した。 ## 関連 - [[@2025__arXiv__The Art of Scaling Reinforcement Learning Compute for LLMs]] - [[Devvrit Khatri]]、[[Inderjit S. Dhillon]]