# Moonshot AI Navigation: [[entities/_index]] | [[index]] ## 概要 中国の AI 企業(正式名称: 月之暗面 / Moonshot AI)。Kimi シリーズの大規模言語モデルを開発する。 - [[Kimi K1.5]]: RL による推論スケーリングで OpenAI o1 に匹敵する性能を達成。コンテキスト長を 128k まで拡張し RL の第三のスケーリング次元を実証。long2short の 4 経路を初めて体系化。 - [[Kimi K2]]: 1.04 兆パラメータ(活性化 32B)の MoE モデルをオープンウェイトで公開。[[MuonClip]] オプティマイザ、23,000 超ツールの大規模エージェント型データ合成パイプライン、分散チェックポイントエンジン(30 秒未満)を開発。`MoonshotAI/checkpoint-engine` として OSS 化。 - [[Kimi K2.5]]: オープンソースチェックポイントが [[Cursor]] の Composer 2/2.5 の基盤モデルとして採用。 - [[Kimi-Researcher]]: 自律型リサーチエージェント。SFT を一切使わず REINFORCE のみで訓練し、Humanity's Last Exam で Pass@1 26.9%、xbench-DeepSearch で 69% を記録。ガンマ減衰報酬・コンテキスト管理(50+ イテレーション)・ターンレベル部分ロールアウトの 3 技術を導入。 - [[Mooncake]]: KVCache 中心の分散推論エンジン。 ## 関連 - [[Kimi K2]] — 1.04 兆パラメータ MoE LLM - [[Kimi K1.5]] — RL 訓練マルチモーダル LLM - [[Kimi K2.5]] — 公開チェックポイント - [[Kimi-Researcher]] — エンドツーエンド RL 訓練リサーチエージェント - [[MuonClip]] — Muon + QK-Clip のオプティマイザ - [[Mooncake]] — 分散推論エンジン - [[Cursor]] — Kimi K2.5 の採用先 ## 出典 - [[@2025__arXiv__Kimi K2 - Open Agentic Intelligence]] - [[@2025__arXiv__Kimi K1.5 - Scaling Reinforcement Learning with LLMs]] - [[@2025__Moonshot AI__Kimi-Researcher - End-to-End RL Training for Emerging Agentic Capabilities]] - [[@2026__Cursor__Introducing Composer 2.5]]