OpenAI Codex 完全指南:从诞生到用法,你需要知道的一切
一、什么是 Codex?
如果你关注 AI 编程工具的发展,「Codex」这个名字一定不陌生。但你可能不知道,这个词在过去几年里实际上指代了两个截然不同的东西——一个是 2021 年的代码补全模型,另一个是 2025 年以来横空出世的自主编程 Agent。了解它的来龙去脉,才能真正用好它。
简单一句话概括:OpenAI Codex 是 OpenAI 推出的 AI 编程助手体系,能够将自然语言指令转化为代码,并以 Agent 形式自主完成复杂软件工程任务。
二、Codex 的诞生与演变历程
第一代 Codex(2021):GitHub Copilot 的引擎
2021 年 8 月 10 日,OpenAI 正式发布了 Codex。它是 GPT-3 的一个改进版本,使用来自数十种编程语言的大量源代码进行微调,也是最初驱动 GitHub Copilot 运转的底层模型。
这一代 Codex 拥有 120 亿参数,在来自 5400 万个 GitHub 仓库的 1590 亿字节 Python 代码上进行了训练。典型的使用方式是:开发者在编辑器里写一行注释,比如 // 计算数组在指定窗口大小下的移动平均值,然后 Codex 自动补全对应的代码块。
这一时期的 Codex 有明显局限性:OpenAI 表示 Codex 能完成约 37% 的请求,定位是加快人类编程速度,而非取代程序员。它在单步任务上表现尚可,但面对多步骤复杂提示往往力不从心,且生成的代码有时存在安全漏洞或风格问题。
尽管如此,它的出现验证了"AI 结对编程"的可行性,直接催生了 Amazon CodeWhisperer、Tabnine 等一批竞品的诞生。
2023 年 3 月,OpenAI 正式弃用了原始 Codex 模型。GitHub Copilot 也随着 Copilot X 升级而转向了更强的 GPT-4 模型。「Codex」这个名字就此沉寂了约两年。
第二代 Codex(2025 起):自主编程 Agent 的新时代
2025 年 5 月 16 日,OpenAI 宣布推出全新 Codex 的研究预览版——一个基于云端的软件工程 Agent,能够并行处理多项任务。Codex 能够为你完成编写功能、回答代码库问题、修复 Bug、提出 Pull Request 供审查等工作;每个任务在独立的云端沙箱环境中运行,并预装了你的代码仓库。
2025 年 4 月 16 日,OpenAI 在 GitHub 上以 Apache 2.0 许可证发布了 Codex CLI,一个运行在用户本地计算机上的 AI Agent 框架。
此后,Codex 的能力升级一路狂飙:
- 2025 年 9 月:发布 GPT-5-Codex,这是一个针对 Codex 中 Agentic 编程场景进一步优化的 GPT-5 版本,同时支持 API 调用。
- 2025 年 12 月:发布 GPT-5.2-Codex,这是迄今为止最先进的 Agentic 编程模型,在长上下文理解、可靠工具调用、事实准确性以及原生上下文压缩(compaction)方面均有显著提升。
- 2026 年 2 月:发布 GPT-5.3-Codex,将 GPT-5.2-Codex 的前沿编程能力与更强的推理和专业知识能力结合在一起,并且比前代快 25%。值得一提的是,这是 OpenAI 第一个参与了自身创造过程的模型——Codex 团队用早期版本来调试自身的训练流程、管理部署,并诊断测试结果与评估数据。
- 2026 年 3 月:GPT-5.4 正式在 Codex 中上线,作为 OpenAI 最强大的前沿模型,它将推理、编程和 Agentic 工作流整合于一身,是目前大多数 Codex 任务的推荐首选。
目前,每周有超过 100 万名开发者在使用 OpenAI 的多 Agent 编程助手 Codex,自 2026 年 1 月以来,使用量已增长 5 倍。
三、Codex 的四种使用入口
现代 Codex 不是一个单一工具,而是一套跨平台的 Agent 体系。根据你的使用场景,有以下四种主要入口。
3.1 Codex Web(云端版)
访问地址:chatgpt.com/codex
这是最直接的方式。每个任务在独立的云端沙箱中运行,沙箱预装了你的代码仓库,Codex 可以并行执行多个任务。适合需要长时间运行、大规模重构或异步委托任务的场景。
操作步骤:
- 登录 ChatGPT,确保你有 Plus、Pro、Business、Edu 或 Enterprise 计划
- 在侧边栏找到 Codex 入口,或直接访问上述地址
- 连接你的 GitHub 仓库
- 用自然语言描述你想做的事情,比如"帮我给这个 Python 函数写单元测试"或"修复 Issue #42 中的 bug"
3.2 Codex CLI(命令行工具)
Codex CLI 是 OpenAI 出品的一个本地运行的编程 Agent,直接在你的终端运行。这是开发者日常使用最灵活的方式,完全开源,托管在 GitHub。
安装方式(二选一):
# 方式一:npm 安装
npm i -g @openai/codex
# 方式二:Homebrew(macOS)
brew install --cask codex
启动 Codex CLI:
codex
首次使用需要登录 ChatGPT 账号或配置 API Key。
常用命令示例:
# 指定模型启动
codex -m gpt-5.4
# 非交互式执行(适合脚本自动化)
codex exec "给 src/utils.py 写文档字符串"
# 在会话中切换模型
/model
CLI 还支持在会话中直接发送补充指令(mid-turn steering),你可以在 Codex 工作的过程中随时发送消息来调整它的行为方向。
3.3 Codex IDE 扩展(VS Code / Cursor / Windsurf)
新的 IDE 扩展将 Codex 带入 VS Code、Cursor 及其他 VS Code 分支中,让你可以无缝预览本地更改并编辑代码。
安装步骤(以 VS Code 为例):
- 打开 VS Code 扩展市场,搜索「OpenAI Codex」
- 安装后,用 ChatGPT 账号登录
- 在编辑器底部的输入框选择模型(如 GPT-5.4)
- 直接在编辑器内提交任务
IDE 扩展的优势在于它与本地文件系统深度集成,可以直接预览 diff、审查代码修改,同时享受云端 Agent 的强大算力。
3.4 Codex 桌面应用(macOS / Windows)
自 2025 年 4 月 Codex 发布以来,开发者与 Agent 的协作方式已发生根本性变化——模型现在能够端到端处理复杂的长时运行任务,开发者正在跨项目编排多个 Agent:委托工作、并行运行任务,并信任 Agent 承担可能跨越数小时、数天甚至数周的大型项目。
Codex 桌面应用正是为这种"多 Agent 指挥中心"场景而生。每个任务在独立线程中运行,按项目归类,你可以一边等某个重构任务跑完,一边让另一个 Agent 写测试用例。
下载方式:
- 命令行安装后运行
codex app - 或从 OpenAI 官网下载 macOS / Windows 安装包
四、Codex 能做什么:核心能力详解
4.1 代码生成与功能开发
这是最基础的用法。给 Codex 一个清晰的需求描述,它会直接写出完整的代码,包括函数、模块乃至整个功能模块。例如:
帮我用 FastAPI 写一个用户注册接口,包含邮箱验证、密码加密(bcrypt),并写好 OpenAPI 文档注释。
4.2 Bug 修复与调试
把报错信息、堆栈追踪或测试失败的输出直接粘贴给 Codex,它能分析根本原因并给出修复方案,甚至直接应用到代码文件上。
4.3 代码库级别的重构与迁移
GPT-5.2-Codex 在大型代码变更(如重构和迁移)方面的表现有显著提升。Codex 能够理解整个仓库的结构,跨文件执行大规模重命名、架构调整、依赖升级等操作。
4.4 自动生成测试
描述你的函数或模块,Codex 会分析代码逻辑,生成覆盖边界条件的单元测试、集成测试,并可以直接执行验证通过率。
4.5 代码审查与 PR 辅助
在 GitHub 中,你可以直接 @Codex 触发代码审查,让它分析 PR 的改动是否符合预期功能,并给出具体的改进建议。
4.6 回答代码库问题
对于刚接触陌生代码库的开发者,Codex 是极好的"导游"。你可以问"这个项目的鉴权逻辑在哪里实现的?"或者"这个接口的调用链是什么?",Codex 会基于你的实际仓库给出准确的回答。
4.7 技能扩展(Skills)
通过技能(Skills)扩展,Codex 可以将 Web 应用部署到 Cloudflare、Netlify、Render 和 Vercel 等流行云服务;使用 GPT Image 驱动的图片生成技能来创建和编辑图片;还可以读取、创建和编辑 PDF、Excel 和 Word 文件。
五、模型选择指南
对于 Codex 中的大多数任务,推荐从 GPT-5.4 开始。它将强大的编程能力、推理能力、原生计算机使用能力和更广泛的专业工作流整合在一个模型中。
| 模型 | 适用场景 | 备注 |
|---|---|---|
| GPT-5.4 | 日常编程、多模态任务、长期 Agent 任务 | 当前推荐默认选择 |
| GPT-5.3-Codex | 复杂软件工程、大型重构 | 前沿编程能力 |
| GPT-5.2-Codex | API 集成、长上下文任务 | API 用户的稳定选择 |
| GPT-5.3-Codex-Spark | 需要极速迭代的实时编程 | 仅 Pro 用户研究预览 |
CLI 中指定模型的方式:
codex -m gpt-5.4
codex -m gpt-5.2-codex
六、定价与订阅方案
Codex 包含在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 计划中,无需额外付费。使用量根据计划有所差异:Plus、Edu 和 Business 每周可以覆盖几次专注的编程会话,而 Pro 则可以支撑整个工作周内跨多个项目的使用。Business 计划可以购买额度以突破包含的限制,Enterprise 计划则提供共享额度池,只为开发者实际使用的部分付费。
对于通过 API Key 使用 Codex CLI 的开发者,gpt-5.2-codex 目前是 API 侧的稳定选择。
七、配置文件详解
Codex CLI 和 IDE 扩展共用同一个 config.toml 配置文件,通常位于 ~/.codex/config.toml。
一个典型的配置如下:
# 指定默认模型
model = "gpt-5.4"
# 审批模式:suggest(仅建议)、auto-edit(自动编辑)、full-auto(全自动)
approval_mode = "suggest"
# 启用 Fast 模式(默认开启)
fast_mode = true
审批模式说明:
suggest:Codex 只提出建议,所有修改需要你手动确认,最安全。auto-edit:Codex 可以直接修改文件,但涉及命令执行仍需确认。full-auto:完全自主,适合在沙箱或测试环境中使用。
八、使用注意事项与避坑指南
✅ 最佳实践
1. 任务描述要具体,边界要清晰
越具体越好。"帮我优化代码"这样的需求太模糊。好的写法是:"重构 src/auth/jwt.py 中的 verify_token 函数,用 python-jose 替代 PyJWT,保持现有测试通过。"
2. 把大任务拆成多个并行的小任务
根据早期测试者的经验,OpenAI 建议同时给多个 Agent 分配边界清晰的任务,并尝试不同类型的任务和提示来探索模型的能力。
3. 附上截图、设计稿或错误截图
你现在可以在 CLI 中直接附带或拖入任何文件类型——截图、线框图、设计图——建立共同上下文,以便获得你真正想要的结果。
4. 善用 mid-turn steering(中途引导)
如果 Codex 工作方向跑偏了,不必等它跑完整个任务再纠正。直接在会话中发消息引导它:"等等,先不要动数据库层,只修改 API 层就好。"
5. 在代码库根目录放置 AGENTS.md 文件
这是 Codex 的"工作说明书"。你可以在其中写明:项目架构约定、编码规范、常用命令(如何运行测试、如何构建)、哪些文件不能动等。Codex 会在任务开始时读取它,大幅提升理解准确度。
⚠️ 注意事项与风险
1. 务必审查所有生成代码再合并
用户在集成和执行之前,对所有由 Agent 生成的代码进行手动审查和验证仍然至关重要。Codex 提供引用、终端日志和测试结果供你核查,但最终判断责任在人。
2. 不要将生产环境密钥上传到 Codex 的沙箱
任务运行在云端隔离沙箱中,但敏感凭据(数据库密码、API Secret)依然不应该直接放在仓库或提示词里。使用环境变量或 Secrets 管理工具。
3. 网络安全相关任务需谨慎
GPT-5.3-Codex 是 OpenAI 在准备框架下首个被评为网络安全"高能力"的模型,也是第一个经过直接训练以识别软件漏洞的模型。这意味着它在安全研究方面能力极强,但也意味着相关请求会被额外的安全系统审查,部分请求可能被路由到能力较弱的模型以防滥用。
4. 注意版权与开源协议问题
Codex 训练数据来自公共代码仓库,极少数情况下生成代码可能与训练数据高度重合。在将生成代码用于商业产品时,建议做必要的代码审计。
5. 长任务注意上下文压缩
对于运行时间极长的任务,Codex 会启用原生上下文压缩(context compaction)来维持上下文完整性,但在任务中间切换太多方向可能导致上下文混乱。尽量在任务开始前把需求说清楚。
九、典型使用场景案例
场景一:独立开发者快速出 MVP
你有一个 App 创意,用 Codex 描述整体架构,让多个 Agent 并行负责前端、后端、数据库 Schema 的搭建,最后让它部署到 Vercel——整个过程可以在几小时内完成原型。
场景二:技术债务清理
在大型遗留项目中,直接告诉 Codex:"把所有用 requests 库的同步调用改成 httpx 的异步版本,保持现有 API 接口不变,并更新测试。" Codex 能跨文件理解依赖关系并系统性地完成修改。
场景三:CI/CD 集成自动修复
Codex Autofix 可以集成到 CI 流程中,实现自动化修复模式。当 CI 检测到测试失败或 lint 错误时,自动触发 Codex 分析并提交修复 PR,大幅减少人工介入。
场景四:安全研究(需申请 Trusted Access)
安全研究人员使用 GPT-5.1-Codex-Max 配合 Codex CLI,通过高频迭代提示的方式,发现并负责任地披露了 React 中一个可能导致源代码泄露的漏洞。
十、总结
OpenAI Codex 走过了从 GPT-3 微调代码补全模型,到今天支持多 Agent 并行、长时运行任务的自主编程系统的完整历程。它不再只是一个"聪明的自动补全",而是一个真正意义上的 AI 软件工程师——你可以委托它完成从写代码、跑测试、提 PR 到部署上线的完整闭环。
对于独立开发者、小型团队来说,掌握 Codex 的正确用法,意味着你可以用一个人的时间干多个人的活。关键在于:给清晰的任务边界,并行利用多 Agent,审查所有产出再合并。
工具已经准备好了,接下来就看你怎么用了。
参考资料:
- OpenAI 官方文档:developers.openai.com/codex
- OpenAI Codex GitHub:github.com/openai/codex
- Codex Changelog:developers.openai.com/codex/changelog
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)