180 美元和 0.28 美元,同一个 token,两个价签。

大家好,我是小虎。

Image

4 月 24 日这天,OpenAI 发布了 GPT-5.5 Pro,API 输出价每百万 token 收 30 美元。

同一天,DeepSeek 发布了 V4,Flash 版输出价 0.28 美元。

几天后,Anthropic 把 Claude Code 的每日成本预估从 6 美元调到了 13 美元。

三个事件放一起,说明一件事。AI 工具正在加速分化。

有的走高端路线,有的走性价比路线。这不奇怪。奇怪的是,很多人把这个分化理解成非黑即白的站队。

我的看法不一样。价格分化不等于能力分化。能用便宜的就不要浪费钱,但贵的有贵的道理。关键是把它们放在正确的位置上。

先看一组数据。

我写文章的时候,顺手测了几个日常场景。

第一个测试是写一个价格监控脚本。让 DeepSeek V4 写一个 Python 脚本,需求是监控商品价格,跌破阈值就弹窗提醒。从说出需求到拿到可运行的代码,不到 5 分钟。跑了几轮迭代,API 成本不到 1 毛钱。

Image

第二个测试是中文口语化。让它用"说真的"开头讲个 200 字的创业故事。输出没有翻译腔,节奏自然,语气像真人说的。这个任务 DeepSeek V4 完成得很顺。

Image

第三个测试是逻辑推理。一个经典的三个猎人题目,它答对了,推理过程清晰。

Image

我又去查了第三方评测数据。SuperCLUE 的最新中文大模型评测报告显示,DeepSeek V4 Pro 综合得分 70.98,国内第一。

Flash 版 68.82 分,国内第二。覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循、幻觉控制六个维度。

在代码领域,Arena.ai 的代码排行榜上,V4 Pro 在开源模型中排名靠前,Vals AI 的 Vibe Code Benchmark 上甚至超越了 Gemini 3.1 Pro。

这些数据说明一件事。DeepSeek V4 在很多场景下不是"够用",是"好用"。

它的 Flash 版以极低的成本,就能输出高质量的日常内容。Pro 版在代码和推理领域的表现,已经可以和闭源模型正面竞争。

但这不是说它能把所有场景都包了。真实的做法,是让每个模型干它最擅长的事。

先说我自己的工作流。

写作和翻译这种偏自然语言处理的事,我交给 DeepSeek V4 Flash。它中文能力强,量大不心疼。一天跑几万个 token,成本不到 3 毛钱。

做小程序、调代码这种需要深度推理的场景,我会切到 codebuddy 国际版的 GPT-5.5。

贵是贵了点,但遇到复杂逻辑和罕见 Bug,它们的调试效率更高。少几轮迭代,总费用反而控制住了。

翻译文档这种标准化任务,DeepSeek V4 就够了。但如果是课程讲义、正式企划书这类需要高度准确的内容,我会用 GPT-5.5 过一遍校对。

每个模型都有自己的主场。没有一个是万能的,也没有一个是废的。

现在说钱的事。

我一天三种场景加在一起,除了 AI 编程以外,大概消耗 11 万 token 的输入和 7 万 token 的输出。

如果全用 GPT-5.5 Pro,一天 2.65 美元,一个月 576 块人民币。

全用 Claude Opus 4.7,差不多 500 块。

全用 DeepSeek V4 Flash,每天 2 毛 7,一个月 7 块 5。

组合使用的账是另一笔算法。DeepSeek V4 跑日常写作和翻译,每天不到 3 毛。

Claude Opus 4.7 跑深度编码场景,平均下来每天大几毛。

GPT-5.5 Pro 跑校对和复杂推理,分摊不到 1 块。加在一起,一个月不超过 100 块。

比全用 DeepSeek 多花一点,但比全用 GPT 省了 80%以上。关键是你得到的是一个按场景优化的结果,不是折中方案。

有学员问我该用哪个。我的回答是,先告诉我你用它干什么。

直接说你今天能做的事。

WorkBuddy 桌面版第一时间把 DeepSeek V4 Flash 集成了。

图片

点界面下方的模型按钮,想用哪个换哪个。不需要配置环境变量,不用折腾 API key。

切换成本为零,你才有动力去试不同的工具。

更实在的是,WorkBuddy 本身送了不少积分。这些积分足够你把每个模型都跑一遍试试,不用自己掏钱充 API 额度。

身边越来越多人在用,也是因为这个原因。下图是我学习群里的学员发我的消息:

Image

讲回到工具的底层逻辑。

GPU 的算力在涨,开源模型能力在涨,闭源模型也在迭代。选型不是一次性的决策,是一个动态过程。

今天 DeepSeek V4 够用,明天需求复杂了可能要上更贵的模型。今天用 GPT 做的活,可能几个月后开源模型就追上了。

保持开放,保持切换能力,比死磕一个工具重要得多。

我给一人公司的 AI 工具建议是这样的。日常内容创作和翻译,用 DeepSeek V4 Flash,量大管饱零焦虑。

深度编码和复杂逻辑推理,用 codebuddy 国际版的 GPT-5.5。

这几种场景基本覆盖了一个人做业务所需的全部 AI 能力。加起来月费不到 100 块。比全用高端模型省了 80%,比只用一个开源模型涨了质量。

但不是所有人都必须这么配。你的场景和我不一样,组合就不一样。

工具是分场景的,不是分高低的。别只看价格标签,看你的活值什么工具。也别只看某个评测分数,看实际用起来哪个更适合你的场景。

把 WorkBuddy 打开,看看里面有几个模型。都试一试。同一篇文章让不同模型各写一遍。

同一个代码需求让不同模型各跑一次。感受差异,然后组装你自己的组合拳。

180 美元和 0.28 美元,两个价签摆在那。不是让你选一个,是看你的活儿值哪个。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐