# Philip Torr [[University of Oxford]] の教授。コンピュータビジョンと機械学習を専門とする著名研究者で、LLM の RL ポストトレーニングにおけるスケーリング挙動の研究にも参画する。 ## 関連ソース - [[@2025__arXiv__Scaling Behaviors of LLM Reinforcement Learning Post-Training]] — 共著者 - [[@2025__arXiv__The Landscape of Agentic Reinforcement Learning]] — 共著者(Agentic RL サーベイ、TMLR 2026)