# MiniMax-M1 [[MiniMax]] が開発した世界初のオープンウェイト大規模ハイブリッドアテンション推論モデル。[[MiniMax-Text-01]] を基盤に、7.5T トークンの継続事前学習 + SFT + [[CISPO]] による大規模 RL で構築。456B 総パラメータ・45.9B アクティベーション/トークン・32 [[Mixture-of-Experts|エキスパート]]。[[Lightning Attention]] とソフトマックスアテンションを 7:1 で交互配置するハイブリッド設計により、100 万トークンのネイティブコンテキスト長と、生成長に対して近似線形の FLOPS スケーリングを実現する。 2 バージョンを公開: MiniMax-M1-40k(思考予算 40K トークン)と MiniMax-M1-80k(80K トークン)。RL 全体を 512 [[H800]] GPU・3 週間・約 53.4 万ドルで完了。SWE-bench Verified 56.0%、TAU-bench(airline) 62.0%、OpenAI-MRCR(128k) 73.4% でオープンウェイト最上位帯。 GitHub: https://github.com/MiniMax-AI/MiniMax-M1 ## 出典 - [[@2025__arXiv__MiniMax-M1 - Scaling Test-Time Compute Efficiently with Lightning Attention]]