# Shihao Cai
[[Tongyi Lab]]([[Alibaba Group]])の研究者。[[AutoForge]]([[@2025__arXiv__AutoForge - Environment Synthesis for Agentic RL]])の共同筆頭著者([[Runnan Fang]] と equal contribution)。ツール記述文書からの模擬環境自動合成と、環境レベル相対方策最適化(ERPO)によるエージェント型強化学習を研究する。
## 関連
- ソース: [[@2025__arXiv__AutoForge - Environment Synthesis for Agentic RL]]
- 所属: [[Tongyi Lab]] / [[Alibaba Group]]
- 共同筆頭著者: [[Runnan Fang]]