概要

6月1日MiniMax M3正式发布并开源,作为一个每天和大模型API打交道的开发者,我第一时间就找渠道接入测试了。之前用GPT-4o和Claude 3.5总觉得有痛点:长上下文太贵不敢用、Coding能力时好时坏、多模态总是差点意思。

这次M3给我的最大惊喜是,它把1M超长上下文、接近Opus的Coding能力、原生多模态这三个开发者最需要的能力打包在了一起,而且价格还压到了一个非常亲民的水平。实测下来,很多之前只能用海外旗舰模型的场景,现在用M3完全可以平替,成本还能降70%以上。

整体架构流程

M3最核心的突破不是参数堆料,而是底层自研的MSA(MiniMax Sparse Attention)稀疏注意力架构

传统的Transformer全注意力机制,是让每个token都和上下文里的所有token做一次计算,这就导致上下文越长,计算量呈指数级增长。而MSA架构用KV-block选择取代了全注意力——它会通过智能算法只挑出最关键的KV-block进行运算,无关的block直接跳过。

这个改动带来了三个革命性的变化:

  1. 支持最高1M(约105万)token的上下文窗口
  2. 1M token长度下,算力成本仅为上一代M2的1/20
  3. 预填充和解码速度大幅提升,长文档处理不再卡顿

简单说,就是用更少的算力,实现了更长的上下文和更快的速度,这也是M3能把长上下文价格打下来的根本原因。

技术名词解释

  • MSA稀疏注意力:MiniMax自研的注意力机制,通过选择性计算关键KV-block,大幅降低长上下文的算力消耗
  • 1M上下文窗口:模型最多可以同时处理约105万token的输入,相当于一次性读取700页Word文档
  • 原生多模态:模型从训练之初就同时学习文本、图片、视频数据,不是后期拼接的多模态能力,理解更准确
  • Computer-Use:模型可以直接操作电脑桌面,执行点击、输入、打开文件等操作,是实现真正智能体的关键能力

技术细节

1. Coding能力:真的超过了GPT-5.5

官方说M3在SWE-Bench Pro评测中拿到了59.0%的成绩,超过GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。我自己实测了几个场景:

  • 重构一个5000行的Python爬虫项目:M3不仅能看懂整个项目的架构,还能指出3个潜在的性能瓶颈,给出的重构方案非常专业
  • 写一个复杂的多线程任务调度脚本:代码逻辑清晰,注释完整,直接就能运行
  • 排查一个隐藏很深的内存泄漏bug:只需要把报错日志和相关代码贴进去,M3很快就定位到了问题所在

整体感受是,M3的Coding能力确实达到了海外旗舰模型的水平,而且对中文开发者更友好,生成的代码注释和文档都是中文的。

2. 长上下文:终于用得起了

这是我最满意的一点。之前用GPT-4o处理一个10万行的代码仓库,光输入就要花几十块钱,根本不敢随便用。

这次我把整个项目的代码(约80万token)一次性喂给M3,让它分析架构并生成开发文档,整个过程只用了不到2分钟,花费不到1块钱。这个成本在以前是想都不敢想的。

我是在数眼智能平台上接入的,M3的VIP价是官方的6折,输入只要1.26元/百万token,缓存读取更是低到0.25元/百万token。对于经常需要处理长文档的开发者来说,这个价格真的太香了。

3. 多模态:原生的就是不一样

和很多后期拼接多模态的模型不同,M3是原生支持图片和视频输入的。我测试了几个场景:

  • 上传一张产品设计图,让M3写对应的前端HTML+CSS代码:生成的代码还原度很高,细节处理得很好
  • 上传一个5分钟的教程视频,让M3总结步骤并生成文字稿:总结得非常准确,连视频里的小细节都没有漏掉
  • 上传一张包含复杂表格的截图,让M3提取数据并生成Excel:数据提取准确率100%

4. API接入:3分钟搞定,完全兼容OpenAI

平台API完全兼容OpenAI SDK,接入非常简单,只需要换个base_url就行,不用改任何业务代码:

from openai import OpenAI

client = OpenAI(
    api_key="你的API密钥",
    base_url="https://platform.shuyanai.com/v1"
)

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[{"role": "user", "content": "分析这个代码仓库的架构并指出可优化点"}]
)

print(response.choices[0].message.content)

而且一个密钥就能同时调用DeepSeek V4、通义千问、豆包、Claude、GPT等30多个主流大模型,不用维护多套密钥,非常方便。

小结

MiniMax M3确实是国产大模型的一次里程碑式的更新。它证明了国产模型不仅能在参数上追上海外,在实际能力上也能达到第一梯队的水平。

优点

  • Coding能力接近Claude Opus 4.7,超过GPT-5.5
  • 1M超长上下文,价格仅为海外模型的1/10
  • 原生多模态,理解更准确
  • 完全开源,支持私有化部署

缺点

  • 512k以上的超长上下文价格会翻倍
  • 视频输入目前只支持较短的视频

对于国内开发者来说,通过数眼智能接入M3是最省心的选择。不用科学上网,价格比官方便宜40%,一个平台就能管理所有主流大模型,还有7×24小时技术支持

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐