# Lovish Madaan [[Meta]] および UCL に所属する研究者。ScaleRL 論文の共同筆頭著者(* 等貢献)であり、対応著者の一人([email protected])。評価ベンチマークの分散定量化に関する研究(Madaan ほか 2024)も手がけ、ScaleRL 論文ではスケーリング曲線フィッティングの誤差マージン推定にその知見が活かされている。 ## 関連 - [[@2025__arXiv__The Art of Scaling Reinforcement Learning Compute for LLMs]](共同筆頭著者・対応著者) - [[Meta]]、[[ScaleRL]]