Kimi Linear - yuuk1's Digital Garden

# Kimi Linear [[Moonshot AI]] が 2025 年 10 月に公開した 48B パラメータの線形アテンションハイブリッド LLM。論文: arXiv:2510.26692。 ## アーキテクチャ Qwen3-Next と同様の 3:1 ハイブリッド設計だが、フルアテンション部分に MLA を採用: ``` Qwen3-Next: KDA(3) + Gated Attention(1) の繰り返し Kimi Linear: KDA(3) + MLA(1) の繰り返し ``` - **KDA(Kimi Delta Attention)**: [[Gated DeltaNet]] の改良版。スカラーゲート → **チャネルワイズゲート**(各特徴次元に個別の忘却・学習率)。長コンテキスト推論の精度改善が目的。 - **MLA(Multi-Head Latent Attention)**: [[Multi-Head Latent Attention]] をグローバルアテンション層として採用。NoPE(RoPE なし)と組み合わせ。位置情報は KDA ブロックに委ねる。 - **NoPE**: MLA 層で位置符号化を適用しない([[NoPE]])。 ## Qwen3-Next との比較 | 設計 | Qwen3-Next | Kimi Linear | |------|------------|-------------| | 線形アテンション | Gated DeltaNet | KDA(チャネルワイズゲート) | | フルアテンション | Gated Attention | MLA | | 位置符号化 | Partial RoPE | NoPE(MLA 層) | | サイズ | 80B-A3B | 48B | ## 性能 Gated DeltaNet-H1 比較で同等の生成速度・高いベンチマーク性能。MLA 比較では高速な生成速度・同等のモデリング精度(DeepSeek-V2 論文アブレーション準拠)。ただし Kimi K2(1T)の 1/20 のサイズのため、大規模モデルへの KDA 採用は今後の検証課題。 ## 意義 MiniMax-M2 が「線形アテンションは本番で精度問題がある」として撤退した後、Kimi Linear はチャネルワイズゲーティングで精度問題に対処できると主張。線形アテンション復活の可能性を示すが、規模・タスクの検証は今後の課題。 ## 関連 - エンティティ: [[Moonshot AI]] / [[Kimi K2]] - 概念: [[Gated DeltaNet]] / [[Multi-Head Latent Attention]] / [[NoPE]] / [[線形注意]] - ソース: [[The Big LLM Architecture Comparison]]