Lovish Madaan - yuuk1's Digital Garden

# Lovish Madaan [[Meta]] および UCL に所属する研究者。ScaleRL 論文の共同筆頭著者（* 等貢献）であり、対応著者の一人（[email protected]）。評価ベンチマークの分散定量化に関する研究（Madaan ほか 2024）も手がけ、ScaleRL 論文ではスケーリング曲線フィッティングの誤差マージン推定にその知見が活かされている。 ## 関連 - [[@2025__arXiv__The Art of Scaling Reinforcement Learning Compute for LLMs]]（共同筆頭著者・対応著者） - [[Meta]]、[[ScaleRL]]