# Shihao Cai [[Tongyi Lab]]([[Alibaba Group]])の研究者。[[AutoForge]]([[@2025__arXiv__AutoForge - Environment Synthesis for Agentic RL]])の共同筆頭著者([[Runnan Fang]] と equal contribution)。ツール記述文書からの模擬環境自動合成と、環境レベル相対方策最適化(ERPO)によるエージェント型強化学習を研究する。 ## 関連 - ソース: [[@2025__arXiv__AutoForge - Environment Synthesis for Agentic RL]] - 所属: [[Tongyi Lab]] / [[Alibaba Group]] - 共同筆頭著者: [[Runnan Fang]]