# Composer 2
[[Cursor Research]] が開発したエージェント型ソフトウェア工学に特化したモデル。[[Kimi K2.5]](1.04T パラメータ / 32B アクティブ、Mixture-of-Experts)をベースに、継続事前学習と大規模 RL の 2 段階で訓練する。
## アーキテクチャ
- ベースモデル: [[Kimi K2.5]](1.04T / 32B active MoE)
- 事前学習: コードデータ支配の混合データ、32K → 256K 系列長拡張 + SFT、MXFP8 精度、NVIDIA B300
- RL: Dr. GRPO ベースの非同期方策勾配、[[PipelineRL]] 同様のインフライト重み更新、MoE ルーティングリプレイ
- 推論高速化: Multi-Token Prediction 層による投機的復号
## ツール
ファイル読み書き、シェルコマンド実行、grep / セマンティック検索、ウェブ検索の少数汎用ツールを使用する。
## 性能
| ベンチマーク | スコア |
|---|---|
| CursorBench-3 | 61.3 |
| SWE-bench Multilingual | 73.7 |
| Terminal-Bench | 61.7 |
フロンティアモデル(GPT-5.4: 63.9 / Opus 4.6: 58.2)と競争力のある精度を、大幅に低い推論コストで達成する。
## 出典
- [[@2026__arXiv__Composer 2 Technical Report]]