University of Oxford - yuuk1's Digital Garden

# University of Oxford 英国オックスフォードの研究大学。[[@2025__arXiv__Scaling Behaviors of LLM Reinforcement Learning Post-Training]] では責任著者 [[Zhenfei Yin]] と Philip Torr の所属として、[[Shanghai AI Laboratory]] と共同で LLM の RL 事後学習のスケーリング則を研究した。