【科研快报】国产大模型重磅突破：编程能力力压GPT-5.5，全球首个三项全能开源模型登场

科研小刘带你玩学术

221人浏览 · 2026-06-09 14:06:27

科研小刘带你玩学术 · 2026-06-09 14:06:27 发布

当全球AI竞争进入白热化阶段，国产大模型再次传来重磅消息。6月1日，MiniMax稀宇科技正式发布第三代旗舰模型MiniMax M3，一口气集齐前沿编程能力、1M超长上下文、原生多模态三大核心特性，成为全球首个同时具备这三项能力的开源模型。

打破垄断：国产模型首次集齐"三项全能"

在此之前，能同时具备这三大能力（编程能力顶尖、支持百万Token上下文、支持原生多模态）的只有GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro等海外头部闭源模型。

MiniMax M3的发布，意味着国内开发者第一次能够免费获取、性能直逼闭源顶级的开源模型。

性能实测：编程评测超越GPT-5.5

在业界公认的编程能力基准测试SWE-Bench Pro上，MiniMax M3得分59.0%，超越GPT-5.5的58.6%和Gemini 3.1 Pro，接近Claude Opus 4.7水平。

这不仅是一个数字的超越，更代表了国产开源模型在软件工程领域的实质性突破。

技术底牌：MSA稀疏注意力架构

M3最核心的技术创新，是全新自研的MSA（MiniMax Sparse Attention）稀疏注意力架构。

传统Transformer的全注意力机制存在一个根本缺陷：计算复杂度随序列长度平方增长。MSA通过选择性计算，将1M上下文下的计算成本压缩至上一代产品的1/20，Prefill加速超9倍，Decoding加速超15倍。

硬核实测：独立复现获奖论文

为了证明三项能力真正同时在线，MiniMax团队把一篇学术论文扔给M3独立复现：

"你给M3一篇图文并茂的学术论文，它需要看懂曲线图、数据、公式，然后编写代码并执行。"

结果：M3连续运行12小时，产出18次commit与23张实验图表，成功复现论文核心实验，并观测到原论文讨论的关键效应。

MiniMax M3的开源，意味着：

个人开发者：无需调用高价API，即可获得顶级Coding能力

企业用户：可私有化部署，数据不出本地

学术研究：完整分析长文档、代码仓库，无需分段处理

目前MiniMax已同步推出MiniMax Code平台，API现已开放使用，技术报告和模型权重将在10天内开源。大家在使用中有什么新发现的话也欢迎在下方交流

版权说明：以上图片均来自NVlabs官方GitHub仓库、开源技术博客及arXiv论文公开资源，版权归属各原作者

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Step3-VL 多模态模型主干代码九章排错与重写

Step3-VL多模态模型代码优化摘要原1074行代码经九章编程法重构为385行，修复20个核心缺陷（含6个致命崩溃级问题）。主要改进：缺陷修复：解决未初始化变量、维度硬编码、参数边界缺失等致命问题架构分层：拆分配置池(C)、数据池(B)、操作池(A)，实现物理隔离边界强化：新增参数校验、异常兜底机制，覆盖输入维度、索引范围等风险点代码精简：清理死代码冗余逻辑，函数职责单一化典型问题示

AtomGit开源社区

Claude 长文档实战：需求文档、代码审查和重构建议怎么做

Claude 更适合长文档、写作润色、代码解释和结构化整理。它不一定适合所有问题，但在需要“读懂大量上下文再输出清晰结构”的任务里很有价值。实际使用时，重点不是追求某个单一工具，而是把 Claude、ChatGPT、Gemini、DeepSeek 等模型组合成稳定工作流。

AtomGit开源社区

从Copilot到Autopilot：AI Agent演进路径

术语简明定义Copilot人机协同模式的AI辅助工具，核心能力是上下文补全、生成建议，人类全程掌握控制权，人在回路中AI Agent具备自主感知、决策、执行能力的AI系统，核心是可以不依赖人类指令自主完成目标任务半自主Agent介于Copilot和Autopilot之间的过渡形态，核心是可以自主完成大部分流程，仅在关键节点需要人类确认Autopilot完全自主级AI Agent，核心是人类只需要给