DeepSWE - yuuk1's Digital Garden

# DeepSWE [[Agentica]] と [[Together AI]] が共同開発した完全オープンソースのコーディングエージェント。Qwen3-32B を基盤とし、SFT を用いず純粋な強化学習(GRPO++)のみで訓練される。[[SWE-Bench-Verified]] で Pass@1 42.2%・Pass@16 71.0%、ハイブリッドテスト時スケーリング Best@16 で 59.0% を達成し、オープンウェイトのコーディングエージェントとして SOTA。4 つの IDE ツール(Bash 実行・検索・ファイルエディタ・完了)で構成される行動空間を持つ。64 基の H100 で 6 日間訓練。モデル重み・訓練コード・データセット・ログをすべて公開している。 - GitHub: https://github.com/agentica-project/rllm - HuggingFace: https://huggingface.co/agentica-org/DeepSWE-Preview (Source: [[@2025__Together AI__DeepSWE - Training a Fully Open-sourced State-of-the-Art Coding Agent by Scaling RL]])