程序员必看:各大模型 API 定价横向对比(2026 年 6 月)
程序员必看:各大模型 API 定价横向对比(2026 年 6 月)
一句话说清楚:你现在调用一次 GPT-5.5 的钱(¥217.5/1M 输出),够调 109 次 qwen-turbo(¥0.6/1M 输出),或 36 次 DeepSeek v4-pro。
选模型是每个开发者的日常。但大多数人的决策流程是:先看能力 → 再看价格 → 然后凭感觉选一个。问题是,大模型的价格差可以达到 200 倍以上,凭感觉选可能让 API 费用轻松翻几倍甚至几十倍。
这篇文章帮你把 2026 年 6 月主流大模型的价格一次性理清楚。数据全部来自各厂商官方定价页面,统一折算为人民币。美元按 1 USD ≈ 7.25 CNY 折算。
价格层级一览:从 ¥0.3 到 ¥1,305
把当前主流旗舰模型按输出价格排个队:
—— 白菜价梯队(¥5/1M 以下)——
| 模型 | 输出价格 | 适用场景 |
|---|---|---|
| qwen-turbo | ¥0.60 / 1M | 极简问答、文本分类、高并发 |
| DeepSeek v4-flash | ¥2.00 / 1M | 轻量对话、缓存友好型场景 |
| qwen-long | ¥2.00 / 1M | 10M 超长上下文 |
| DeepSeek v4-pro(促销) | ¥6.00 / 1M | 复杂推理、长文生成、代码 |
—— 性价比梯队(¥7~20/1M)——
| 模型 | 输出价格 | 适用场景 |
|---|---|---|
| qwen3.6-flash | ¥7.20 / 1M | 通用对话、内容生成 |
| qwen3.6-plus | ¥12.00 / 1M | 多模态(图片+视频)、中文创作 |
| qwen3.6-max | ¥20.00 / 1M | 旗舰中文能力、复杂任务 |
| DeepSeek v4-pro(常规价) | ¥24.00 / 1M | 促销结束后恢复此价 |
—— 进阶梯队(¥36~218/1M)——
| 模型 | 输出价格 | 适用场景 |
|---|---|---|
| Claude Haiku 4.5 | ¥36.25 / 1M | 英文轻量任务 |
| Claude Sonnet 4.6 | ¥108.75 / 1M | 代码生成、复杂分析 |
| Claude Opus 4.7 | ¥181.25 / 1M | 顶尖推理、学术研究 |
| OpenAI GPT-5.5 | ¥217.50 / 1M | 综合旗舰、多模态 |
—— 豪华梯队(¥1,000+/1M)——
| 模型 | 输出价格 | 适用场景 |
|---|---|---|
| OpenAI GPT-5.5-pro(≤128K) | ¥1,305.00 / 1M | 极端复杂任务 |
| OpenAI GPT-5.5-pro(1M) | ¥1,957.50 / 1M | 长上下文+极端复杂 |
(以上均为最低上下文档位价格。各模型在更高上下文或思考模式下有溢价)
容易踩的 3 个价格坑
坑一:tokenizer 差异导致实际成本不同
Anthropic 公开承认 Opus 4.7 使用新 tokenizer,同样文本多消耗 35% token。这意味着:你花 ¥181.25 买的 Claude Opus 4.7 输出 1M token,实际生成的内容量可能和别的模型 740K token 差不多。
选型时不要只看「每百万 token 价格」,要结合实际业务场景做小规模测试,算「每千字价格」。
坑二:缓存命中 vs 未命中差距巨大
各家缓存策略差异很大。缓存命中时输入成本可降低 90% 以上:
| 厂商/模型 | 缓存未命中输入 | 缓存命中输入 | 折扣幅度 |
|---|---|---|---|
| DeepSeek v4-flash | ¥1.00 | ¥0.02 | 98% off |
| DeepSeek v4-pro(促销) | ¥3.00 | ¥0.025 | 99% off |
| OpenAI GPT-5.5 | ¥36.25 | ¥3.63 | 90% off |
| Claude Opus 4.7 | ¥36.25 | ¥3.63 | 90% off |
如果你有大量重复的 system prompt 或多轮对话前缀,缓存带来的成本差异可能超过一个数量级。DeepSeek 的缓存策略尤其激进。
坑三:长上下文悄悄加价
很多模型对超过一定长度的上下文额外收费,加价幅度 50%~100%:
| 厂商/模型 | 短上下文价格 | 长上下文价格 | 加价幅度 |
|---|---|---|---|
| OpenAI GPT-5.5 输出 | ¥217.50(≤128K) | ¥326.25(>128K) | +50% |
| qwen3.6-plus 输出 | ¥12.00(≤128K) | ¥24.00(128K-1M) | +100% |
| qwen3.6-max 输出 | ¥20.00(≤128K) | ¥36.00(128-262K) | +80% |
| Claude Opus 4.7 | ¥181.25(全窗口) | 同价 | 无加价 ✅ |
| DeepSeek v4-pro | ¥6.00(全窗口) | 同价 | 无加价 ✅ |
如果你需要传大量上下文(完整代码库、长文档),优先考虑 Claude 或 DeepSeek,避免加价陷阱。
一个真实的成本计算案例
假设做一个 AI 写作助手,日活 5000 用户,每人每天 5 次调用,每次平均 1500 个输出 token(使用 ≤128K 上下文):
日输出量 = 5000 × 5 × 1500 = 3750 万 tokens/天
月输出量 ≈ 11.25 亿 tokens
选 qwen-turbo(¥0.6/1M 输出):
月成本 = 1125 × 0.6 = ¥675
选 DeepSeek v4-pro 促销(¥6/1M 输出):
月成本 = 1125 × 6 = ¥6,750
选 Claude Sonnet 4.6(¥108.75/1M 输出):
月成本 = 1125 × 108.75 = ¥122,344
选 GPT-5.5(¥217.5/1M 输出):
月成本 = 1125 × 217.5 = ¥244,688
同样的产品,月成本从 ¥675 到 ¥244,688,相差 362 倍。
中文场景实测建议
主要做中文产品的话:
- 首选 qwen-turbo 或 DeepSeek v4-flash:¥0.6~2/1M 输出,中文能力完全够用
- 需要更强能力:DeepSeek v4-pro(促销期),中文 T0 级别
- 需要多模态:qwen3.6-plus(¥12/1M),支持图片+视频输入
- 极致低价+超长上下文:qwen-long(¥2/1M),10M 上下文
不推荐纯中文场景用 OpenAI/Claude:同样能力下贵 10-30 倍,且中文输出不一定比国产模型好。
省钱技巧总结
- 缓存是你的朋友:system prompt 和多轮对话前缀天然可缓存。DeepSeek v4-flash 缓存命中只要 ¥0.02/1M(不缓存的 1/50)
- 能用小模型就别用大的:很多场景 qwen-turbo 或 flash 级别完全够用
- 中文场景优先国产模型:DeepSeek、通义千问、智谱在中文上的性价比远超 OpenAI 和 Claude
- Batch 调用能省一半:几乎所有厂商的 Batch API 都有 50% 折扣
- 避免长上下文浪费:每次都把整本书塞进 prompt 是烧钱最快的方式,用 RAG 只传相关上下文
- 关注促销:DeepSeek v4-pro 的 2.5 折促销、qwen-turbo 的 ¥0.6/1M 超低价,都是真实在跑的促销
💰 想实时查看各大模型的最新定价、免费额度、促销活动?LLMTokenPrice(llmtokenprice.com)整理了 39+ 家大模型厂商的完整价格数据,涵盖 API 按量计费和订阅套餐,数据全部来自厂商官方页面,每周更新。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)