OpenAI 又双叒发新模型了。

北京时间3月18日,OpenAI 官宣了两个新模型:GPT-5.4 miniGPT-5.4 nano。其中,mini 已经进入 ChatGPT、Codex 和 API,nano 则 仅限 API。官方给它们的定位很明确:更快、更便宜,重点服务 编码、计算机使用、多模态理解、子代理任务

图片

一、这次 OpenAI 到底更新了什么?

OpenAI 官方表示,GPT-5.4 mini 已经上线 ChatGPT、Codex 和 API,而 GPT-5.4 nano 则只面向 API 用户开放。

官方对 GPT-5.4 mini 的定位:

专为编码、计算机使用、多模态理解和子代理任务优化,比 GPT-5 mini 快 2 倍。

其中:

  • GPT-5.4 mini:已经进入 ChatGPT、Codex 和 API 体系

  • GPT-5.4 nano:更偏向极低成本、高并发的调用场景

  • mini 负责更强的执行和协作,nano 负责更便宜的标准化任务

这其实已经不只是“发两个新模型”这么简单了,而是在补一块非常关键的拼图: 让小模型真正进入产品工作流和 Agent 架构。

图片

二、具体性能如何?

代码能力:SWE-Bench Pro

  • GPT-5.4 mini:54.4%

  • GPT-5 mini:45.7%

  • GPT-5.4:57.7%

这意味着,GPT-5.4 mini 相比前代直接提升了将近 9 个百分点,而且已经非常接近 GPT-5.4 本体。

计算机使用 / 截图理解:OSWorld-Verified

  • GPT-5.4 mini:72.1%

  • GPT-5.4:75.0%

在这类更偏“电脑操作”和“界面理解”的任务上,它也已经逼近大模型。

除此之外,官方还给出了几组数据:

  • Terminal-Bench 2.0:60.0%

  • Toolathlon:42.9%

  • GPQA Diamond:88.0%

  • MMMUPro:76.6%

一句话总结就是:

GPT-5.4 mini 已经不是那种“只能干点边角活”的小模型了。很多原本只有大模型能扛的任务,它现在也能接住,而且速度更快。

图片

三、价格也很猛

除了性能,这次更让人关注的,其实是价格。

  • GPT-5.4 mini:输入 0.75 美元 / 百万 tokens,输出 4.50 美元 / 百万 tokens

  • GPT-5.4 nano:输入 0.20 美元,输出 1.25 美元

这个价格意味着很多以前“理论上能做、实际上不舍得跑”的功能,现在开始变得现实了。

比如:

  • 高并发的自动化脚本

  • 更便宜的 AI Agent

  • 批量调用的工具链任务

  • 需要持续运行的小型子代理

  • 大量分类、抽取、排序、清洗类工作

说得更直接一点,OpenAI 现在不只是想做“最强模型”,而是要做一整套更适合落地的模型梯队

大模型负责规划, mini 负责执行, nano 负责高频脏活。

这套思路,已经非常像下一阶段 Agent 产品的基础设施了。

图片

四、为什么会引发大家对GPT-4o 的怀念?

这就是这次发布最有戏剧性的地方。

按理说,一个更快、更便宜、编码更强的小模型上线,评论区应该是一片“真香”。

结果并没有。

大部分用户又把话题扯回了 GPT-4o。因为就在今年 2 月 13 日,OpenAI 已经把 GPT-4o 从 ChatGPT 中下线,虽然 API 里还保留,但在 ChatGPT 端,用户已经不能再直接使用它了。

而自从 GPT-4o 被下线之后,网上一直有一股很强的情绪没有消失——那就是 keep4o

不少用户并不是因为 GPT-4o“技术能力最强”才喜欢它,而是因为它的对话风格更自然、更有陪伴感、更像一个能交流的对象。这种反弹甚至大到 TechCrunch、Business Insider、The Guardian 都专门写了报道,讨论 GPT-4o 退场后引发的用户失落、抗议,以及人们为什么会对一个模型产生如此强的情感依赖。

对很多普通用户来说,他们并不是把 AI 只当作一个“完成任务的机器”。

他们在意的,还有另外一些东西:

  • 聊天时的自然度

  • 回应里的情绪感

  • 表达方式里的温度

  • 长期使用后形成的熟悉感

而 GPT-4o,恰恰在这方面留下了非常强的用户印象。

所以这次就出现了一个很典型的反差:

OpenAI 在推一个更高效的新模型,用户却在怀念一个更有“人味”的旧模型。

这不是技术问题,而是产品体验问题。

图片

结尾

OpenAI 当然没做错。

从产品逻辑、成本逻辑和工程逻辑看,GPT-5.4 mini 都是一条非常正确的路。它更像一个能真正跑进业务流里的模型,而不只是实验室里的成绩单。

keep4o 这股情绪也提醒了所有大模型公司:

技术会继续往前走,模型会越来越快、越来越便宜、越来越适合接入系统。 但用户真正记住的,可能不只是跑分和价格。

还有它曾经带来的那种感觉。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐