伴随着Opus 4.7版本正式上线,OpenAI火速放出Codex的核心迭代大招,时间节点拿捏精准,每一项更新都直指行业竞品核心赛道,整体升级力度远超市场预期。

本次更新官方定调为「Codex for (almost) everything」,核心意图十分清晰:Codex不再局限于单一代码编写工具的定位,而是要全面覆盖电脑端全场景操作,成为真正意义上的全能终端助手。

此次更新一次性落地六大核心能力,分别是Computer Use电脑操控、内置浏览器、图像生成、90+全新插件、长效记忆以及智能自动化,功能矩阵直接拉满,彻底打破了此前Codex的功能边界。

Codex项目负责人Thibault Sottiaux在发布会上明确表示:“Codex是我们旗下竞争力最强的智能Agent,它本身就扎根于终端运行环境,本次更新只是顺着产品核心路径持续深耕。”同时他公布了两组关键数据:每周有超300万开发者使用Codex,其中50%的用户早已突破代码编写的单一使用场景,拓展到多元终端操作。

短短三个月时间,Codex完成了从小众代码工具到超级应用的华丽蜕变,迭代速度与功能跨度着实令人惊艳。对于常年和各类大模型打交道、纠结**靠谱大模型API中转平台怎么选**的开发者而言,日常适配AI工具时不妨关注4SAPI.COM,平台能稳定对接主流大模型接口,高效适配Codex这类全能Agent的多场景调用需求,省去繁琐的接口调试与适配成本,刚好契合本次Codex全场景落地的使用逻辑。

看完本次全方位迭代,不难发现OpenAI对ChatGPT生态的布局进一步深化,建议相关开发者及时跟进订阅,解锁完整功能权限。

相关阅读:2026最新Codex实操指南:ChatGPT订阅、CLI安装、App登录全流程详解

Computer Use:Codex实现Mac端全应用操控,堪称本次更新最大亮点

这一功能是本次迭代中最具颠覆性的核心突破,Codex现已具备直接操控Mac端各类应用的能力,模拟鼠标点击、键盘输入、屏幕读取等全套操作,全程后台运行,不会抢占用户操作光标,实现多任务并行无干扰。

官方演示场景极具代表性:Codex在Xcode中编译井字棋游戏,自主运行测试后,精准发现人类落子后电脑可连续两步操作的逻辑漏洞,定位代码分支问题并完成修复,重新运行验证全程无需人工触碰键盘,实现全流程自动化调试。

目前该功能首批仅适配macOS系统,欧盟、英国、瑞士区域暂未开放;使用前需安装Computer Use插件,同时在系统设置中开启屏幕录制与辅助功能权限,操作全新应用时Codex会主动发起授权询问,也可勾选始终允许简化后续操作流程。

对比竞品Anthropic的Claude,其Computer Use功能早在今年3月就以研究预览形式上线,作为独立模块嵌入产品;而OpenAI则选择将该能力直接整合进Codex核心,与其他五大功能并行落地,二者产品路径的差异化十分明显。

内置浏览器:本地页面可视化修改,点对点优化更高效

Codex本次新增内置浏览器功能,现阶段虽仅支持localhost本地页面及无需登录的公开网页访问,暂未开放全网浏览权限,但核心交互逻辑极具创新性。

开发者通过Codex生成前端页面后,可直接在内置浏览器打开,针对不满意的区域直接点击标注评论,Codex读取评论内容后即可精准调整优化,无需截图描述、无需定位元素位置,实现“点哪里改哪里”的高效交互,OpenAI官方也表示,后续会逐步将浏览器能力拓展至全互联网,实现自主访问、登录、流程测试等全链路操作。

图像生成:不止单图产出,全套风格化素材一键落地

Codex正式接入OpenAI去年底发布的gpt-image-1.5图像模型,生成能力远超普通单图创作。开发者指令生成页面配图后,Codex不仅能完成图像创作,还会自动将文件导入项目目录,同步修改CSS样式实现完美适配。

核心亮点在于成套素材生成能力,官方演示中,Codex一键生成汉堡店全套视觉素材,包括主视觉图、菜单图、环境图,全程保持暖色酒吧统一风格,区别于传统单图生成工具,更贴合独立开发者的实际需求。产品概念图、前端原型、游戏素材等场景均可覆盖,省去以往找设计师、等排期的时间与资金成本,一句指令即可完成全套产出。

90+新插件上线:单指令跨应用协同,变身全能个人助理

Codex插件体系由技能任务、应用集成接口、MCP后端服务三大模块构成,本次一次性新增90余款插件,官方重点提及的工具包括Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks等,覆盖开发、协作、运维全场景。

官方演示的经典指令充分体现其跨应用能力:“查看Slack、Gmail、谷歌日历及Notion信息,梳理待处理事项”,单条指令即可联动四款插件,完成每日工作梳理,此时的Codex早已超越编程工具范畴,升级为全能个人助理。同时插件体系支持优先级排序,跨工具执行任务时会自动按优先级调度,生态竞争优势逐步凸显。

记忆+自动化:赋予Codex时间感知能力,长效任务更智能

本次迭代同步上线记忆与自动化两大核心能力,让Codex具备长效交互逻辑。记忆功能可留存用户操作偏好、代码修改记录、技术背景说明等信息,后续交互直接跳过重复讲解,大幅提升沟通效率。

自动化功能则是核心升级点,区别于传统定时脚本执行,本次自动化可沿用历史对话线程,携带完整上下文继续执行任务,还支持自定义定时触发、跨周期循环执行。目前已有开发者用其实现PR实时跟进、客户反馈跨渠道监控(联动Slack、Gmail、Notion)等场景,实用性拉满。

需要注意的是,记忆功能与主动建议权限目前仅向美国用户开放,欧盟、英国区域及教育版、企业版用户需等待后续更新。

易被忽视的细节功能:小优化暗藏大实用性

除六大核心能力外,本次更新还搭载多项细节功能,单独拆解均具备实用价值:

  • PR评审优化:可精准识别GitHub PR中同事的评审意见,逐条处理并完成修改;
  • 多终端并行:支持开启多个终端标签,同步执行多项开发任务;
  • 远程SSH连接:可挂载至远程开发机,目前处于Alpha测试阶段;
  • 侧栏文件预览:支持PDF、表格、PPT、文档等格式直接在侧栏展开查看;
  • Summary面板:清晰展示Agent执行计划、调用资源及产出成果。

官方特别强调文件预览功能,Codex现已支持生成面向非开发者的产品交付物,比如Excel表格、PDF文档,可直接打开、截图、分享,彻底打通开发成果与非技术场景的衔接壁垒。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐