# Composer 2 [[Cursor Research]] が開発したエージェント型ソフトウェア工学に特化したモデル。[[Kimi K2.5]](1.04T パラメータ / 32B アクティブ、Mixture-of-Experts)をベースに、継続事前学習と大規模 RL の 2 段階で訓練する。 ## アーキテクチャ - ベースモデル: [[Kimi K2.5]](1.04T / 32B active MoE) - 事前学習: コードデータ支配の混合データ、32K → 256K 系列長拡張 + SFT、MXFP8 精度、NVIDIA B300 - RL: Dr. GRPO ベースの非同期方策勾配、[[PipelineRL]] 同様のインフライト重み更新、MoE ルーティングリプレイ - 推論高速化: Multi-Token Prediction 層による投機的復号 ## ツール ファイル読み書き、シェルコマンド実行、grep / セマンティック検索、ウェブ検索の少数汎用ツールを使用する。 ## 性能 | ベンチマーク | スコア | |---|---| | CursorBench-3 | 61.3 | | SWE-bench Multilingual | 73.7 | | Terminal-Bench | 61.7 | フロンティアモデル(GPT-5.4: 63.9 / Opus 4.6: 58.2)と競争力のある精度を、大幅に低い推論コストで達成する。 ## 出典 - [[@2026__arXiv__Composer 2 Technical Report]]