MiniMax M3 实测：国产大模型终于追上了海外第一梯队

勤劳搬运的AI鼠鼠

572人浏览 · 2026-06-03 14:02:42

勤劳搬运的AI鼠鼠 · 2026-06-03 14:02:42 发布

文章目录

概要

6月1日MiniMax M3正式发布并开源，作为一个每天和大模型API打交道的开发者，我第一时间就找渠道接入测试了。之前用GPT-4o和Claude 3.5总觉得有痛点：长上下文太贵不敢用、Coding能力时好时坏、多模态总是差点意思。

这次M3给我的最大惊喜是，它把1M超长上下文、接近Opus的Coding能力、原生多模态这三个开发者最需要的能力打包在了一起，而且价格还压到了一个非常亲民的水平。实测下来，很多之前只能用海外旗舰模型的场景，现在用M3完全可以平替，成本还能降70%以上。

整体架构流程

M3最核心的突破不是参数堆料，而是底层自研的MSA（MiniMax Sparse Attention）稀疏注意力架构。

传统的Transformer全注意力机制，是让每个token都和上下文里的所有token做一次计算，这就导致上下文越长，计算量呈指数级增长。而MSA架构用KV-block选择取代了全注意力——它会通过智能算法只挑出最关键的KV-block进行运算，无关的block直接跳过。

这个改动带来了三个革命性的变化：

支持最高1M（约105万）token的上下文窗口
1M token长度下，算力成本仅为上一代M2的1/20
预填充和解码速度大幅提升，长文档处理不再卡顿

简单说，就是用更少的算力，实现了更长的上下文和更快的速度，这也是M3能把长上下文价格打下来的根本原因。

技术名词解释

MSA稀疏注意力：MiniMax自研的注意力机制，通过选择性计算关键KV-block，大幅降低长上下文的算力消耗
1M上下文窗口：模型最多可以同时处理约105万token的输入，相当于一次性读取700页Word文档
原生多模态：模型从训练之初就同时学习文本、图片、视频数据，不是后期拼接的多模态能力，理解更准确
Computer-Use：模型可以直接操作电脑桌面，执行点击、输入、打开文件等操作，是实现真正智能体的关键能力

技术细节

1. Coding能力：真的超过了GPT-5.5

官方说M3在SWE-Bench Pro评测中拿到了59.0%的成绩，超过GPT-5.5和Gemini 3.1 Pro，接近Claude Opus 4.7。我自己实测了几个场景：

重构一个5000行的Python爬虫项目：M3不仅能看懂整个项目的架构，还能指出3个潜在的性能瓶颈，给出的重构方案非常专业
写一个复杂的多线程任务调度脚本：代码逻辑清晰，注释完整，直接就能运行
排查一个隐藏很深的内存泄漏bug：只需要把报错日志和相关代码贴进去，M3很快就定位到了问题所在

整体感受是，M3的Coding能力确实达到了海外旗舰模型的水平，而且对中文开发者更友好，生成的代码注释和文档都是中文的。

2. 长上下文：终于用得起了

这是我最满意的一点。之前用GPT-4o处理一个10万行的代码仓库，光输入就要花几十块钱，根本不敢随便用。

这次我把整个项目的代码（约80万token）一次性喂给M3，让它分析架构并生成开发文档，整个过程只用了不到2分钟，花费不到1块钱。这个成本在以前是想都不敢想的。

我是在数眼智能平台上接入的，M3的VIP价是官方的6折，输入只要1.26元/百万token，缓存读取更是低到0.25元/百万token。对于经常需要处理长文档的开发者来说，这个价格真的太香了。

3. 多模态：原生的就是不一样

和很多后期拼接多模态的模型不同，M3是原生支持图片和视频输入的。我测试了几个场景：

上传一张产品设计图，让M3写对应的前端HTML+CSS代码：生成的代码还原度很高，细节处理得很好
上传一个5分钟的教程视频，让M3总结步骤并生成文字稿：总结得非常准确，连视频里的小细节都没有漏掉
上传一张包含复杂表格的截图，让M3提取数据并生成Excel：数据提取准确率100%

4. API接入：3分钟搞定，完全兼容OpenAI

平台API完全兼容OpenAI SDK，接入非常简单，只需要换个base_url就行，不用改任何业务代码：

from openai import OpenAI

client = OpenAI(
    api_key="你的API密钥",
    base_url="https://platform.shuyanai.com/v1"
)

response = client.chat.completions.create(
    model="MiniMax-M3",
    messages=[{"role": "user", "content": "分析这个代码仓库的架构并指出可优化点"}]
)

print(response.choices[0].message.content)