# Lovish Madaan
[[Meta]] および UCL に所属する研究者。ScaleRL 論文の共同筆頭著者(* 等貢献)であり、対応著者の一人(
[email protected])。評価ベンチマークの分散定量化に関する研究(Madaan ほか 2024)も手がけ、ScaleRL 論文ではスケーリング曲線フィッティングの誤差マージン推定にその知見が活かされている。
## 関連
- [[@2025__arXiv__The Art of Scaling Reinforcement Learning Compute for LLMs]](共同筆頭著者・対応著者)
- [[Meta]]、[[ScaleRL]]