2026 年 4 月 15 日,OpenAI 发布了新版 Agents SDK。从官方说明来看,这一版的重点非常明确:让 Agent 不只是“会调用模型”,而是能在受控环境中检查文件、运行命令、编辑代码,并持续处理长任务。

如果只看表面,这像是一次 SDK 能力扩展;但如果从工程视角看,这其实是在回答一个更关键的问题:

当 Agent 从 Demo 走向生产之后,底层基础设施到底应该长什么样?

一、这次更新到底更新了什么

根据 OpenAI 在 2026 年 4 月 15 日的官方文章,这次 Agents SDK 更新主要集中在三件事上:

  1. 更强的 Agent harness

  2. 原生 sandbox execution

  3. 将 harness 和 compute 分离,以支持安全、持久和扩展

换句话说,可以理解成:

  1. Agent 不再只是一层“模型调用封装”

  2. SDK 开始内建“文件系统 + 命令执行 + 工具编排 + 长任务状态管理”

  3. OpenAI 开始把 Agent 运行时视为一个真正的系统,而不是一次推理请求

这也是为什么这次更新特别强调了四个关键词:文件、命令、沙箱、长任务,这四个点,基本对应了生产级 Agent 最难补齐的四块能力。

二、技术重点一:文件能力不是附属功能,而是 Agent 的工作上下文

OpenAI 这次更新里,一个非常重要的信号是:文件系统正式变成 Agent 的一等公民。

过去很多 Agent demo 的输入,通常只是几段文本或者一次工具返回结果。但真实业务里,Agent 处理的往往是“工作区”而不是“单条消息”,这意味着 Agent 需要的不是单轮上下文,而是可持续访问的工作目录。

OpenAI 在新版 SDK 中引入了更明确的文件工作模式,比如:

  • 提供受控 workspace

  • 让 Agent 能读取输入文件

  • 让 Agent 能把中间结果写回目录

  • 通过 Manifest 描述文件挂载和输出位置

官方示例里就使用了 ManifestLocalDir,把一个本地目录挂载给 Agent:

import asyncio
import tempfile
from pathlib import Path

from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes import UnixLocalSandboxClient

async def main() -> None:
    with tempfile.TemporaryDirectory() as tmp:
        dataroom = Path(tmp) / "dataroom"
        dataroom.mkdir()
        (dataroom / "metrics.md").write_text(
            "# Annual metrics\n\nFY2025 revenue: $124.3M\nFY2024 revenue: $98.7M\n",
            encoding="utf-8",
        )

        agent = SandboxAgent(
            name="Dataroom Analyst",
            model="gpt-5.4",
            instructions="Answer using only files in data/. Cite source filenames.",
            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
        )

        result = await Runner.run(
            agent,
            "Compare FY2025 revenue with FY2024.",
            run_config=RunConfig(
                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
            ),
        )
        print(result.final_output)

asyncio.run(main())

这段代码最值得关注的,不是语法本身,而是它体现出的新运行模式:Agent 的输入不再只是 prompt,而是“文件 + 指令 + 工作区”。

这对很多企业场景非常关键。因为一旦 Agent 能围绕文件工作,它就更接近真实工作流,而不只是聊天机器人。

三、技术重点二:命令执行能力,让 Agent 从“回答”走向“操作”

这次更新里,OpenAI 明确把 shell tool 作为标准能力的一部分。这意味着 Agent 不只是能“理解任务”,还可以在受控环境中执行命令。

这一点非常重要。很多任务本质上不是语言任务,而是操作任务,比如:跑脚本、检查目录、处理文件、安装依赖、调用本地工具、生成输出结果。如果没有命令执行能力,很多 Agent 最后都会退化成“给你一段建议,你自己去做”。

而一旦能执行命令,Agent 的能力边界就明显扩展了。它可以自己完成更长链路的工作,例如:

  1. 读取一批输入文件

  2. 调用脚本做预处理

  3. 生成中间产物

  4. 汇总结论

  5. 写回最终结果

从技术上看,这其实意味着 OpenAI 正在把 Agent 从“推理接口”推进到“轻量执行器”。

当然,这里最关键的问题不是“能不能执行”,而是能不能在受控条件下执行。这也就引出了这次更新的第三个核心点:原生沙箱。

四、技术重点三:原生沙箱,解决的不是隔离本身,而是运行时可信性

这次 Agents SDK 更新里,OpenAI 最值得关注的能力之一,就是 native sandbox execution。

官方的意思很明确:很多有价值的 Agent,都需要一个真正的执行环境,在里面安全地读写文件、运行代码、调用命令、组织工作目录等。以前做这件事,团队通常要自己拼容器、执行器、文件挂载、清理与恢复机制等。而现在OpenAI 直接把这层运行时能力纳入了 SDK 体系。

更重要的是,这次更新不是只给一个固定环境,而是引入了 Manifest abstraction,让开发者可以用统一方式描述 Agent 的运行空间,比如:

  • 挂载本地文件

  • 指定输出目录

  • 从对象存储挂数据

  • 让不同 sandbox provider 之间保持可移植

OpenAI 官方还提到可以接入多个环境提供方,并允许自带 sandbox。这个设计思路很关键,因为它表明 OpenAI 并不是想把 Agent 封成黑盒,而是在做一套可迁移的运行时抽象。

这对企业很重要。因为企业真正需要的从来不是一个“神秘托管 Agent”,而是:能接自己的数据、能跑自己的环境、能控制权限边界、能纳入自己的安全策略。

五、技术重点四:长任务支持,说明 OpenAI 开始认真处理 Agent 的持久性

很多 Agent demo 都有一个共同问题:一旦任务变长,系统就不稳。

原因很简单。多步任务天然会遇到这些情况:

  • 上下文变长

  • 工具调用次数增加

  • 执行链路更复杂

  • 单个容器可能中途失败

  • 中间状态容易丢失

所以“长任务支持”真正难的地方,从来不是模型能不能继续说,而是系统能不能保住任务状态。这也是为什么OpenAI 在这次更新里专门写了一个很重要的设计点:separating harness from compute。也就是把 Agent 的控制层和执行层拆开。这背后至少有三层意义。

1. 安全性

OpenAI 官方明确提到,Agent 系统应该默认面临 prompt injection 和 data exfiltration 风险。把 harness 和 compute 分离,可以避免凭据直接暴露在模型生成代码执行的环境里。简单说就是:

  • 控制层保留状态、策略、权限

  • 执行层只做局部工作

  • 即使某个 sandbox 被污染,也不会直接拖垮整条链路

2. 持久性

如果 Agent 状态是外置的,那么即使一个 sandbox 容器挂掉,任务也不用从头开始。OpenAI 提到 SDK 支持 snapshotting 和 rehydration。也就是说,当执行环境失效时,系统可以在新容器里恢复任务状态并继续执行。这对长任务尤其关键,因为它把 Agent 从“脆弱脚本”变成了“可恢复流程”。

3. 可扩展性

官方还提到可以:

  • 一个任务用一个 sandbox

  • 一个任务拆多个 sandbox

  • 只在需要时调用 sandbox

  • 把 subagents 路由到不同隔离环境

  • 在多个容器里并行处理

这说明 OpenAI 对 Agent 的理解,已经不是“单线程对话循环”,而是开始接近分布式任务执行框架。

六、这次更新真正重要的地方,不是功能变多了,而是 Agent 基础设施开始收敛

如果把这次 Agents SDK 更新放到更大的技术背景里看,最值得关注的一点是Agent 基础设施正在从“自己拼”走向“标准化收敛”。过去很多团队做 Agent通常要自己组合,结果就是每家公司都在重复写一套半成品运行时。

OpenAI 这次更新的意义,在于它开始把这类通用能力抽象成 SDK 基础设施。开发者可以把更多精力放在领域逻辑上,而不是反复造 Agent runtime 的轮子。

从这个角度说,2026 年 4 月 15 日这次更新,真正释放的信号不是“Agent 更强了”,而是:Agent 正在从实验室技术,进入工程系统阶段。

七、这对数据层提出了什么新要求

如果 Agent 现在已经有了文件工作区、命令执行、沙箱环境、长任务恢复,那么下一步最现实的问题就是Agent 在这个运行时里到底消费什么数据?

很多 Agent 之所以做不深,不是因为缺模型,而是因为缺稳定的数据输入层。 尤其是在市场研究、搜索增强、行业跟踪、竞品分析等等这些场景。这些任务都需要 Agent 在长任务过程中持续获取外部信息。问题也因此变得更具体:

  • 数据能不能结构化进入 Agent

  • 数据能不能挂载进 workspace

  • 数据能不能持续更新

  • 数据能不能支持后续检索、分析和生成

也就是说,当 Agent 的运行时标准化之后,数据接入层反而会成为新的瓶颈。

八、Dataify 可以如何辅助这类 Agent 系统

在新版 Agents SDK 的架构下,Dataify 这类数据能力可以很自然地放进 Agent 工作流里,主要有三种位置。

1. 作为 Agent 的外部信息入口

例如用搜索结果接口给 Agent 提供候选来源,再用网页采集能力补正文,最后把结果写入 Agent 的工作目录。

一个简化的思路大概会是这样:

# 伪代码:先获取外部公开数据,再交给 Agent 工作区处理

serp_results = dataify_serp_api(
    query="AI agent observability",
    region="us",
    language="en"
)


docs = [ ]

for item in serp_results["organic_results"][:5]:
    page = dataify_web_api(url=item["url"], render_js=True)
    docs.append({
        "title": page["title"],
        "content": page["content"],
        "source": item["url"]
    })

save_to_workspace(docs, path="./workspace/input/")
run_agent_task("./workspace/input/")

这里的关键不在于调用形式,而在于整个链路变得更清晰:

外部数据接入 -> 结构化处理 -> 挂入 workspace -> Agent 执行长任务

2. 作为长任务中的持续数据补给层

新版 Agents SDK 强调长任务和可恢复执行,这意味着 Agent 可能运行更久、分更多阶段完成工作。 在这种情况下,静态输入不够,Agent 需要持续的数据补给。

比如:

  • 第一轮搜集搜索结果

  • 第二轮抓取网页正文

  • 第三轮补充视频和评论

  • 第四轮生成报告并回写文件

这类链路里,Dataify 更适合做稳定的数据供给层,而不是一次性抓取脚本。

3. 作为 Agent 与现实世界之间的数据接口层

很多企业真正缺的不是模型,也不是运行时,而是外部数据如何稳定进入系统。

这也是 Dataify 的价值所在:把原本分散、脆弱、维护成本高的公开数据接入链路,收敛成更标准化的 API 和数据服务能力,让 Agent 可以直接消费。

十、结尾

如果要总结 2026 年 4 月 15 日这次 OpenAI Agents SDK 更新,我觉得最重要的一句话是:

OpenAI 不再只是在更新一个 Agent SDK,而是在定义生产级 Agent 的基础设施形态。

文件、命令、沙箱、长任务,这四个点之所以重要,不是因为它们让 Agent “看起来更厉害”,而是因为它们解决了 Agent 从 Demo 走向生产必须面对的核心问题:

  • 怎么运行

  • 怎么隔离

  • 怎么恢复

  • 怎么扩展

而当运行时这部分越来越成熟之后,下一步最关键的,就是数据层。

Agent 要长期工作,必须持续获得高质量、结构化、可消费的数据输入。 这也正是 Dataify 能发挥作用的地方:不是替代 Agent runtime,而是为这类 runtime 提供更稳定的外部数据能力,让 Agent 真正能把任务做完。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐