[[University of Science and Technology of China]] State Key Laboratory of Cognitive Intelligence の研究者。ATSF ポジションペーパーの第 1 著者で、公式コード `github.com/Mingyue-Cheng/atsf` を管理する。連絡先 [email protected]。 時系列とエージェントを横断する研究グループの中心で、ATSF の文献では同グループの一連の研究が多数引用される(TimeMAE、ConvTimeNet、TimeReasoner=「Can slow-thinking LLMs reason over time?」、Agent-R1、Mind2Report、InstructTime++ ほか)。ATSF の代表実装として参照される [[Cast-R1]](Cheng は第 2 著者、source: [[@2026__arXiv__Cast-R1 - Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting]])および CastMind/MemCast もこのグループ由来である。 [[Agent-R1]] テクニカルレポート(arXiv:2511.14460, 2025)の筆頭著者でもある。同論文ではステップレベル MDP 抽象化と柔軟なコンテキスト管理を核心に据えたエージェント型 RL 訓練フレームワークを提案し、PPO・GRPO・Reinforce++・RLOO の 4 アルゴリズムを同一基盤上で比較した。(Source: [[@2025__arXiv__Agent-R1 - Training Agents with End-to-End RL]]) ## 関連 - 所属: [[University of Science and Technology of China]] - 共著者: [[Xiaoyu Tao]]、[[Qi Liu]]、[[Enhong Chen]] - ソース: [[@2026__arXiv__Position Beyond Model-Centric Prediction - Agentic Time Series Forecasting]]、[[@2025__arXiv__Agent-R1 - Training Agents with End-to-End RL]]