主流推理模型架构的协议对比表格，和专利坑专利埋雷

zhangfeng1133 · 2026-05-26 17:58:33 发布

模型/系列	协议类型	商用限制	MAU/规模限制	下游传播要求	专利授权
Qwen 3 / 3.5	Apache 2.0	❌ 无	❌ 无	保留声明即可	✅ 含
Mistral Large 3 / Small 4 / Mixtral	Apache 2.0	❌ 无	❌ 无	保留声明即可	✅ 含
Gemma 4	Apache 2.0	❌ 无	❌ 无	保留声明即可	✅ 含
DeepSeek V4	MIT	❌ 无	❌ 无	保留版权声明	❌ 无
GLM-5.1	MIT	❌ 无	❌ 无	保留版权声明	❌ 无
Kimi K2.6	Modified MIT	⚠️ 月活 ≥ 1 亿需授权	100M MAU	保留版权声明	❌ 无
Llama 4	Meta Community License	⚠️ 月活 ≥ 7 亿需授权	700M MAU	需传递协议限制	❌ 无
Gemma 3	Google Gemma Terms of Use	⚠️ 有禁止用途清单	❌ 无 MAU 上限	限制必须逐层传递	❌ 无
Mistral Large 2	Mistral Research License	❌ 研究/评估 only	—	商用需签企业协议	❌ 无
Codestral	Non-Production License	❌ 非生产环境	—	商用需申请	❌ 无

Qwen 3/3.5、Mistral Large 3/Small 4、Gemma 4、DeepSeek V4、GLM-5.1

Apache 2.0（Qwen、Mistral Large 3、Gemma 4）：最推荐。无商用限制、无 MAU 上限，且含专利授权，企业法务最放心。
MIT（DeepSeek V4、GLM-5.1）：同样零限制，但不含专利授权条款。对普通开发者没区别，大企业法务可能更偏好 Apache 2.0。

Kimi K2.6、Llama 4

Kimi K2.6：Modified MIT，月活超 1 亿需向月之暗面申请授权。对中小团队无感，但做平台级产品（微信、抖音体量）有合规门槛。
Llama 4：Meta Community License，月活超 7 亿需书面授权。限制比 Kimi 更宽松（7 亿 vs 1 亿），但协议本身更复杂，且对欧盟多模态场景有额外限制。

Gemma 3

不是 Apache 2.0，也不是 MIT。使用 Google 自有的 Gemma Terms of Use。
最大坑点：下游传播限制必须逐层传递。你基于 Gemma 3 微调后的模型，分发时必须让下游用户也遵守 Google 的禁止用途政策。Apache/MIT 没这要求。
好消息：Gemma 4 已彻底切换到 Apache 2.0，上述限制全部取消。

Mistral Large 2、Codestral、部分旧版 Mistral 模型

Mistral Large 2：Research License，只允许研究和评估，商用必须签企业协议。
Codestral：Non-Production License，明确禁止生产环境商用，需单独申请。
注意：Mistral Large 3 和 Small 4 已改回 Apache 2.0，Large 2 的限制不代表 Mistral 全家桶。Devstral 2 和 Medium 3.5 则是 Modified MIT（允许商用，但可能有收入限制条款）。

你的场景	推荐协议梯队	代表模型
创业/中小公司，不想碰法务	Apache 2.0	Qwen 3、Mistral Large 3、Gemma 4
大厂/平台级产品（月活过亿）	标准 MIT/Apache 2.0	DeepSeek V4、GLM-5.1、Qwen 3
做前端/UI/视觉编程	按需选，协议不是瓶颈	GLM-5V（MIT）、Qwen3-Coder-Next（Apache 2.0）
严格数据主权/欧洲合规	Apache 2.0 + 欧洲厂商	Mistral 系列（法国本土训练）
已有 Llama 生态，不换架构	接受 Meta 条款	Llama 4（注意 700M MAU 墙）

关键提醒：同一家公司不同版本的协议可能完全不同。比如 Gemma 3 是 Google ToU，Gemma 4 是 Apache 2.0；Mistral Large 2 受限，Large 3 完全开放。选型时务必核对具体模型版本的 License 文件，不要凭品牌印象做决定。

MIT 协议本身没有专利授权条款，这是它的天然缺陷。但"有专利坑"通常指的不是 MIT 协议本身，而是模型厂商在 MIT 之外额外声明的专利政策，或历史上存在的专利争议。

以下是主流模型中，使用 MIT 或类似宽松协议、但专利方面需要留意的：

模型	表面协议	专利隐患	具体情况
Llama 全系列	Meta Community License（非 MIT）	⚠️ 专利地雷	Meta 明确保留专利权利，未授予用户专利许可。社区多次质疑其专利池布局。
Kimi K2.6	Modified MIT	⚠️ 无专利授权	MIT 本身无专利条款，月之暗面也未额外声明专利许可。
DeepSeek V4	标准 MIT	⚠️ 无专利授权	同 MIT 天然缺陷，但 DeepSeek 未声明额外专利限制。
GLM-5.1	标准 MIT	⚠️ 无专利授权	同 MIT 天然缺陷，智谱未声明额外专利限制。
Mistral Devstral 2 / Medium 3.5	Modified MIT	⚠️ 无专利授权	同 Kimi K2.6。

MIT 协议只有三句话，核心是：

允许任何人免费获得软件副本，可以无限制地处理软件（包括使用、复制、修改、合并、发布、分发、再许可和/或销售），唯一条件是保留版权声明。

MIT 没有提到专利。这意味着：

Llama 用的是 Meta 自己写的 Community License，不是 MIT。协议里明确：

“This license does not grant you any rights under any patent or other intellectual property rights of Meta.”

翻译：Meta 保留所有专利权利，不给你任何专利许可。

这意味着如果你用 Llama 做大后被 Meta 告专利侵权，协议本身不保护你。社区一直质疑 Meta 是否在通过开源布局专利陷阱。

Apache 2.0 第 3 条明确规定：贡献者授予用户永久、全球、免版税、非排他的专利许可。这是企业法务最放心的条款。

你的顾虑	建议
怕被告专利侵权	优先选 Apache 2.0（Qwen 3、Mistral Large 3、Gemma 4），专利授权写进协议。
用 MIT 模型（DeepSeek/GLM/Kimi）	实际风险极低，这些厂商没有专利诉讼历史，但法律上确实没有专利保护。
用 Llama	协议主动排除专利授权，Meta 有专利池布局嫌疑，大厂需谨慎法务评估。