GitHub 地址https://github.com/openai/openai-agents-python

简介

OpenAI Agents SDK​ 是 OpenAI 官方开源的 Python 框架,专为构建生产级多智能体(Multi-Agent)应用而设计。它采用“轻量但强大”的理念,提供极简的 API 抽象,让开发者能快速编排多个 AI 智能体协同完成复杂任务。

不同于传统的单模型调用,该 SDK 将 LLM 视为具备规划、工具调用和状态管理能力的“工作者”。它原生支持 Agent-as-Tool(智能体即工具)和 Handoffs(任务移交)机制,并内置了安全护栏(Guardrails)和全链路追踪(Tracing)能力。虽然由 OpenAI 维护,但它并非模型锁定,通过 LiteLLM 兼容支持 100+ 种第三方大模型,具备极高的灵活性。

主要功能

1. 多智能体编排与移交(Orchestration & Handoffs)

这是 SDK 的核心能力。你可以构建一个“经理”智能体,根据任务类型将工作移交(Handoff)给更专业的“员工”智能体(如代码专家、文案写手)。这种机制模拟了真实团队的分工协作,解决了单一模型“样样通、样样松”的问题。

2. 沙盒智能体(Sandbox Agents)

自 v0.14.0 起引入的重磅特性。传统的 Agent 通常在内存中运行,而沙盒 Agent 运行在受控的容器环境中,拥有真实的文件系统、进程和网络访问权限。这意味着 Agent 可以执行克隆代码库、运行测试、修改配置文件等真实操作,而不仅仅是生成文本,极大地扩展了自动化运维的边界。

3. 生产级安全与可观测性

  • 安全护栏(Guardrails):支持在输入(Pre-Execution)和输出(Post-Execution)阶段注入 LLM 或自定义逻辑进行验证,防止 Agent 执行危险操作或输出不良内容。

  • 全链路追踪(Tracing):内置可视化调试界面,可以清晰看到每一次运行的详细步骤、工具调用记录和 Token 消耗,方便排查逻辑问题。

4. 实时语音与多模态

通过安装 [voice]扩展,可以基于 gpt-realtime-1.5​ 模型构建低延迟的语音对话应用(如语音客服、实时翻译),支持自动语音检测和上下文管理。

5. 模型无关性(Provider Agnostic)

虽然名为 “OpenAI”,但 SDK 底层支持通过 LiteLLM 统一接口调用 OpenAI、Anthropic、Google Gemini 乃至本地部署的 Ollama 模型,避免了厂商锁定。

安装与配置

环境要求

  • Python 3.10+:必须使用较新版本的 Python。

  • OpenAI API Key:如果使用 OpenAI 模型,需设置环境变量。

安装步骤

  1. 创建虚拟环境(推荐):

    python -m venv .venv
    source .venv/bin/activate  # Windows: .venv\Scripts\activate
  2. 安装核心包

    pip install openai-agents

    若使用更快的 uv包管理器:

    uv add openai-agents
  3. 安装可选扩展

    • 语音支持pip install 'openai-agents[voice]'

    • Redis 会话存储(用于持久化状态):pip install 'openai-agents[redis]'

  4. 配置密钥

    在终端或 .env文件中设置:

    export OPENAI_API_KEY="sk-your-key-here"

如何使用

基础流程:创建并运行智能体

SDK 的使用遵循“定义 Agent → 使用 Runner 执行”的极简模式。

  1. 定义智能体:为其赋予名称、角色指令(Instructions)和可用工具(Tools)。

  2. 运行任务:通过 Runner.run()发送用户消息,SDK 会自动处理与模型的交互、工具调用和状态管理。

  3. 获取输出:返回的 result对象包含最终回复、中间步骤及会话状态。

关键概念:工具与移交

  • 工具(Tools):将任意 Python 函数装饰为工具,Agent 在需要时会自动调用。例如,定义一个 search_web函数,Agent 就能在回答问题时使用它。

  • 移交(Handoffs):在 Agent 配置中指定 handoffs列表。当主 Agent 认为自己无法处理某子任务时,会自动将上下文和任务转交给指定的专家 Agent。

沙盒模式的使用

沙盒 Agent 需要显式配置环境(镜像、资源限制)。在沙盒中,Agent 可以执行 subprocess命令、读写文件,其状态(如安装的依赖)可以跨任务快照保存,非常适合自动化 DevOps 任务。

应用场景实例(无代码)

场景一:自动化代码审查与修复流水线

痛点:代码合并请求(PR)的人工审查耗时耗力,且简单的格式错误占用大量精力。

SDK 方案

  1. 构建一个“代码审查 Agent”,其指令为“你是一名资深架构师,严格检查代码风格和安全漏洞”。

  2. 将其配置为沙盒模式,使其能 git clone目标仓库并运行 linttest命令。

  3. 设置安全护栏:仅允许在沙盒内运行命令,且禁止访问敏感环境变量。

  4. 价值:PR 触发后,Agent 自动拉取代码,运行检查,生成包含具体错误位置和修复建议的报告,甚至自动提交修复 commit,实现“无人值守”的代码质量守护。

场景二:多专家协作的内容创作工作室

痛点:单一模型生成的市场文案可能缺乏深度或数据支撑。

SDK 方案

  1. 组建一个虚拟团队:“研究员 Agent”(擅长网络搜索)、“文案写手 Agent”(擅长文风润色)、“合规审核 Agent”(擅长检查敏感词)。

  2. 使用移交机制:用户向“经理 Agent”下达指令“写一篇关于 AI 趋势的文章”。经理将任务拆解,先移交给“研究员”搜集资料,再移交給“写手”撰写,最后移交給“审核”把关。

  3. 价值:通过分工协作,产出的内容既有数据支撑,又符合品牌调性,且规避了合规风险,质量远超单次对话生成的结果。

场景三:带人工审批的高风险操作自动化

痛点:企业希望用 AI 自动处理客服工单(如退款申请),但涉及金钱交易必须有人类监督。

SDK 方案

  1. “客服 Agent”​ 负责与用户沟通,收集订单号和问题描述,并生成初步处理建议(如“建议退款 50%”)。

  2. 配置 Human-in-the-loop(人机回环)​ 护栏:当 Agent 的建议涉及“退款”或“补偿”时,流程自动暂停,并向预设的客服主管发送审批通知。

  3. 主管在可视化界面点击“通过”或“驳回”后,流程继续执行。

  4. 价值:既利用了 AI 的 24/7 响应效率,又在关键决策点保留了人类控制权,确保业务安全。

总结

OpenAI Agents SDK 标志着 AI 应用开发从“单次对话”迈向了“多角色工作流”的新阶段。它的沙盒执行能力移交机制使其特别适合构建复杂的自动化系统(如 DevOps、数据分析),而模型无关性则让非 OpenAI 用户也能享受其优秀的框架设计。对于希望将 AI 深度集成到业务流程中的团队,这是一个极具价值的官方工具。

GitHub 地址https://github.com/openai/openai-agents-python

官方文档https://openai.github.io/openai-agents-python/

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐