# Philip Torr
[[University of Oxford]] の教授。コンピュータビジョンと機械学習を専門とする著名研究者で、LLM の RL ポストトレーニングにおけるスケーリング挙動の研究にも参画する。
## 関連ソース
- [[@2025__arXiv__Scaling Behaviors of LLM Reinforcement Learning Post-Training]] — 共著者
- [[@2025__arXiv__The Landscape of Agentic Reinforcement Learning]] — 共著者(Agentic RL サーベイ、TMLR 2026)