# Boris Yangel
Navigation: [[entities/_index]] | [[sources/_index]]
論文投稿時点では Humanoid 所属。マルチターン SWE エージェントの強化学習訓練に関する論文(arXiv:2508.03501, 2025)の最終著者(研究は [[Nebius AI]] 在籍時に実施)。
同論文では [[Alexander Golubev]] らとともに、棄却ファインチューニング(RFT)と DAPO を組み合わせた 2 段階パイプラインで Qwen2.5-72B-Instruct を SWE-bench Verified Pass@1 39% に到達させた。SWE-rebench データセットの構築(arXiv:2505.20411)やガイド付き探索手法(arXiv:2505.13652)にも共著者として参加している。
## 主な業績
- [[@2025__arXiv__Training Long-Context Multi-Turn SWE Agents with Reinforcement Learning]](最終著者)
- SWE-rebench(arXiv:2505.20411、共著)
- Guided Search Strategies(arXiv:2505.13652、共著)
## 出典
- (Source: [[@2025__arXiv__Training Long-Context Multi-Turn SWE Agents with Reinforcement Learning]])