当全球AI竞争进入白热化阶段,国产大模型再次传来重磅消息。6月1日,MiniMax稀宇科技正式发布第三代旗舰模型MiniMax M3,一口气集齐前沿编程能力、1M超长上下文、原生多模态三大核心特性,成为全球首个同时具备这三项能力的开源模型。

打破垄断:国产模型首次集齐"三项全能"

在此之前,能同时具备这三大能力(编程能力顶尖、支持百万Token上下文、支持原生多模态)的只有GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro等海外头部闭源模型。

MiniMax M3的发布,意味着国内开发者第一次能够免费获取、性能直逼闭源顶级的开源模型。

性能实测:编程评测超越GPT-5.5

在业界公认的编程能力基准测试SWE-Bench Pro上,MiniMax M3得分59.0%,超越GPT-5.5的58.6%和Gemini 3.1 Pro,接近Claude Opus 4.7水平。

这不仅是一个数字的超越,更代表了国产开源模型在软件工程领域的实质性突破。

技术底牌:MSA稀疏注意力架构

M3最核心的技术创新,是全新自研的MSA(MiniMax Sparse Attention)稀疏注意力架构。

传统Transformer的全注意力机制存在一个根本缺陷:计算复杂度随序列长度平方增长。MSA通过选择性计算,将1M上下文下的计算成本压缩至上一代产品的1/20,Prefill加速超9倍,Decoding加速超15倍。

硬核实测:独立复现获奖论文

为了证明三项能力真正同时在线,MiniMax团队把一篇学术论文扔给M3独立复现:

"你给M3一篇图文并茂的学术论文,它需要看懂曲线图、数据、公式,然后编写代码并执行。"

结果:M3连续运行12小时,产出18次commit与23张实验图表,成功复现论文核心实验,并观测到原论文讨论的关键效应。

MiniMax M3的开源,意味着:

  • 个人开发者:无需调用高价API,即可获得顶级Coding能力

  • 企业用户:可私有化部署,数据不出本地

  • 学术研究:完整分析长文档、代码仓库,无需分段处理

目前MiniMax已同步推出MiniMax Code平台,API现已开放使用,技术报告和模型权重将在10天内开源。大家在使用中有什么新发现的话也欢迎在下方交流


版权说明:以上图片均来自NVlabs官方GitHub仓库、开源技术博客及arXiv论文公开资源,版权归属各原作者

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐