不仅是 Copilot:AI Agent Harness Engineering 如何从辅助角色进化为业务执行主体?

关键词:AI Agent Harness Engineering、Copilot进化、业务执行主体、智能体编排、Agent可靠性、LLM生产落地、自主智能体
摘要:2023年以来,各类Copilot产品已经渗透到代码开发、办公协作、客户服务等多个场景,但始终停留在「辅助建议」的角色,无法端到端完成全链路业务任务。本文将从核心概念、技术原理、落地实战多个维度,拆解AI Agent Harness Engineering(智能体管控工程)如何通过构建一套完整的任务拆解、校验、容错、管控体系,让AI Agent从「只会出主意的副驾驶」进化为「能扛指标的业务执行主体」,帮助企业实现LLM落地的最后一公里突破,带来10倍以上的业务效率提升。


背景介绍

问题背景

你有没有过这样的经历:用代码Copilot写功能,它给你生成了10行代码,你要花20分钟改Bug、调参数、适配业务规则;用办公Copilot做报表,它给你出了公式和模板,你还要自己导数据、核对数值、对齐公司VI格式;用客服Copilot回用户问题,它给你生成了回复草稿,你还要人工核对订单信息、确认售后规则才敢发出去。

这就是当前所有Copilot产品的共性痛点:它永远是「副驾驶」,只会给建议,决策权和执行权永远在人类手里,你要为它的所有结果负责,最终效率只能提升30%-50%,远远达不到大家对AI的预期

为什么会出现这个问题?不是大模型不够聪明,而是我们缺少一套「安全可控的AI控制系统」:大模型就像一个智商很高但没有规矩、经常走神的天才小孩,你让他去买酱油,他可能半路追蝴蝶跑了,可能拿成醋,可能不给钱就走,你不敢让他独立完成任务,只能牵着他的手一步一步走——而AI Agent Harness Engineering就是给这个天才小孩装的牵引绳、定位项圈、行为规范手册、应急处理方案,让他能安安全全、完完整整把任务做完,不需要你全程跟着。

目的和范围

本文将完整讲解AI Agent Harness Engineering的核心概念、技术架构、算法原理、落地方法,帮你搞懂:

  1. 什么是Harness Engineering,它和普通的Agent编排有什么区别?
  2. 怎么通过Harness体系让Agent从辅助角色变成业务执行主体?
  3. 落地Harness Engineering的步骤、工具、最佳实践有哪些?
  4. 不同行业的Agent主体落地案例和未来发展趋势。

本文不涉及太深的大模型底层算法,适合产品经理、技术架构师、业务负责人、算法工程师阅读,哪怕你没有AI基础也能看懂。

术语表

术语 通俗解释 专业定义
AI Agent Harness Engineering 给AI Agent装的「安全操作系统」,包含规则、校验、容错、管控全套体系 围绕智能体全生命周期执行的管控工程体系,覆盖任务拆解、调度编排、结果校验、异常自愈、权限管控、合规审计全链路,保障Agent执行的可靠性、可控性、可追溯性
Copilot模式 副驾驶模式,AI只给建议,人类决策和执行 以人类为核心决策主体,AI仅提供单个步骤的辅助建议、内容生成能力,人类全程参与任务全流程
业务执行主体模式 自动驾驶模式,AI独立完成端到端任务,只有关键节点才找人类 以Agent为核心执行主体,AI独立完成任务拆解、执行、校验全流程,仅在超出规则范围的异常场景才触发人类介入,人类参与度低于5%
Harness层 夹在大模型和业务系统之间的管控中间层 承接用户指令、输出业务结果的中间管控层,是Harness Engineering的核心载体,隔离大模型的不确定性和业务系统的稳定性要求

核心概念与联系

故事引入

我们拿开网约车举个例子:

  • 最早你自己开车,旁边坐个朋友给你指路:「前面左转,那条路不堵」「前面有个乘客要上车,你停一下」——这就是最原始的人工模式,朋友的建议就是早期的AI辅助能力。
  • 后来你装了导航,导航不仅给你指路,还能自动避开拥堵、提醒你限速、告诉你哪里有厕所——这就是现在的Copilot模式,导航只会给建议,握方向盘、踩油门、处理突发状况还是你自己来。
  • 再后来你换了自动驾驶车,你输入目的地,它自己握方向盘、变道、超车、停车、避让行人,遇到修路的情况它会自己绕路,实在解决不了的问题才会提醒你接管——这就是Agent作为业务执行主体的模式。
  • 而Harness Engineering就是给自动驾驶车做的整套操作系统:感知系统、决策系统、安全系统、故障处理系统、规则系统,没有这套系统,再强的雷达和芯片(对应大模型)也不敢让它自己上路。

核心概念解释(小学生都能懂版)

核心概念一:AI Agent Harness Engineering

你养了一只特别聪明的边牧(就是大模型),它能听懂你说的所有话,会开门、会拿快递、会买东西、会照顾小朋友。但你要是直接让它自己去超市帮你买酱油,它可能半路看到小猫就追跑了,可能拿成醋,可能拿了酱油不给钱就走,可能把钱弄丢了。

而Harness Engineering就是你给这只边牧准备的全套装备和规则:

  1. 牵引绳和定位项圈:你随时能看到它走到哪了,做了什么
  2. 任务清单:贴在它项圈上,写清楚「1. 扔门口垃圾 2. 去超市买一瓶生抽 3. 取快递柜的包裹」
  3. 行为规则:「不能追小猫、不能拿别人的东西、买东西要给钱、拿错了要换」
  4. 应急方案:「要是生抽卖完了就给主人发消息问要不要换味极鲜,要是钱不够就回来拿」
  5. 核对机制:「买完东西要核对小票对不对,快递要核对取件码」

有了这套东西,你就可以放心躺沙发上玩游戏,10分钟后边牧就把三件事都干完了,全程不需要你插手——这就是Harness Engineering的作用:把不可控的大模型能力,变成可落地的、安全的业务执行能力。

核心概念二:Copilot模式

还是这只边牧,你牵着它的手一起去超市,你告诉它「去拿生抽」,它就去拿,你不说它就不动,所有决策都是你做,它只是帮你拎东西、递东西——这就是Copilot模式,AI永远是辅助,人类永远是主导。

核心概念三:业务执行主体模式

你给边牧说一句「去把酱油买了」,它自己出门、自己扔垃圾、自己买酱油、自己取快递,中间遇到生抽卖完的情况自己给你发消息问要不要换,你回个「可以」它就自己处理,所有小事都自己搞定,只有需要你决策的大事才找你——这就是业务执行主体模式,AI是主力,人类只做兜底。

核心概念四:Harness层

就是刚才说的牵引绳、定位项圈、任务清单、规则、应急方案的总和,是夹在大模型和外部世界(工具、业务系统、用户)之间的中间层,所有大模型的输出都要经过Harness层的校验才能对外执行,所有外部的输入都要经过Harness层的处理才能传给大模型,就像一个严格的守门员,把所有风险都挡在外面。

核心概念对比与关系

Copilot模式 vs 业务执行主体模式对比表
对比维度 Copilot模式 业务执行主体模式
决策主体 人类 Agent(Harness层管控)
人类参与度 70%-100%,全程参与 <5%,仅异常场景介入
任务范围 单个步骤的辅助 端到端全链路业务任务
可靠性要求 ≥90%,错误由人类修正 ≥99.9%,错误直接影响业务
Harness层复杂度 低,仅简单工具调用 高,覆盖全链路管控
效率提升 30%-50% 300%-1000%
典型应用 代码Copilot、文档生成助手 自动售后处理、自动财务报销、自动供应链调度
概念之间的关系
  1. 大模型是动力,Harness层是方向盘:再强的大模型,没有Harness层的管控,也不能直接用到业务里,就像发动机再强,没有方向盘和刹车,车也不敢开。
  2. Copilot是Harness Engineering的初级形态:早期的Harness层只有简单的工具调用能力,只能做辅助,随着Harness层的能力越来越强,就会慢慢进化到业务执行主体模式。
  3. 业务规则是Harness层的灵魂:不同行业的Harness层要适配不同的业务规则,比如电商的售后Harness要符合退换货规则,金融的报销Harness要符合财务合规规则,没有业务规则的Harness层就是空架子。

核心架构文本示意图

[业务入口层] 用户指令 / 业务事件触发(比如用户提交售后工单、系统触发报销流程)
    ↓
[Harness管控层] (核心)
    ├─ 任务拆解模块:把模糊需求拆成可执行的子任务,排好依赖和优先级
    ├─ 调度编排模块:把子任务分配给对应的Agent/工具执行,管控执行顺序
    ├─ 校验审计模块:每个子任务执行完都校验结果是否符合业务规则,全链路留日志
    ├─ 异常自愈模块:子任务出错时自动重试/换方案执行,无法解决则触发人工介入
    └─ 权限合规模块:管控Agent的访问权限,符合隐私和行业合规要求
    ↓
[Agent执行层]
    ├─ 大模型:决策、推理、生成能力
    ├─ 记忆模块:存储历史任务信息、用户信息、业务规则
    └─ 工具调用模块:调用第三方工具、内部业务系统、数据库API
    ↓
[底层能力层] 业务系统/第三方工具/数据库/硬件设备

Mermaid架构图

ER实体关系图
渲染错误: Mermaid 渲染失败: Parse error on line 2: ...iagram USER ||--o HARNESS : 下发指令接收结果 ----------------------^ Expecting 'ZERO_OR_ONE', 'ZERO_OR_MORE', 'ONE_OR_MORE', 'ONLY_ONE', 'MD_PARENT', got 'UNICODE_TEXT'
任务执行流程图

接收业务指令

Harness任务拆解

Harness权限校验

分配Agent执行

Agent调用LLM决策

Agent调用工具或业务系统

Harness结果校验

校验是否通过

是否所有子任务完成

Harness异常处理

是否可自愈

触发人工介入

人工处理后返回结果

Harness汇总结果

反馈给用户


核心算法原理 & 数学模型

核心算法原理

Harness Engineering的核心是用确定性的工程体系,抵消大模型的不确定性,核心算法包括3个部分:

1. 任务拆解算法:基于ToT(Tree of Thought)的结构化拆解

要让Agent独立完成任务,首先要把用户的模糊需求拆成可执行的、有依赖关系的子任务,我们用「思维树+业务规则模板」的混合模式:

  • 先让大模型把用户需求拆成3-8个层级的子任务,每个子任务满足「可执行、可校验、边界清晰」的要求
  • 然后用业务规则模板匹配,把不符合业务规则的子任务替换成标准流程,比如售后工单的拆解结果必须包含「订单核验、规则匹配、执行操作、用户通知」四个固定步骤
  • 最后用动态规划算法算出最优执行路径,优先执行依赖前置、风险低的子任务
2. 结果校验算法:RAG+规则引擎的双重校验

每个子任务执行完都要做校验,避免Agent出错:

  • 规则引擎校验:先跑硬规则,比如售后退换货必须满足「订单在7天内、商品不影响二次销售」,不符合直接驳回
  • RAG校验:把执行结果和业务知识库、历史正确案例做相似度匹配,相似度低于95%的触发二次校验
  • 高风险场景额外增加人类抽检:比如涉及金额超过1000元的工单,自动触发人工审核
3. 异常自愈算法:基于强化学习的重试调度

如果子任务执行失败,Harness层会自动尝试不同的解决方案:

  • 一级自愈:重试3次,每次换不同的提示词、不同的工具
  • 二级自愈:调整子任务顺序,先执行其他不依赖的子任务,等资源就绪后再重试
  • 三级自愈:如果重试5次还是失败,触发人工介入,同时把这个异常场景加入训练集,优化后续的调度策略

数学模型

1. 任务可靠性计算公式

Harness体系下整个任务的成功率可以用以下公式计算:
Rtotal=Rharness×[1−∏k=1m(1−Ragent,k×Rtool,k×Wk)] R_{total} = R_{harness} \times \left[1 - \prod_{k=1}^{m} (1 - R_{agent,k} \times R_{tool,k} \times W_k)\right] Rtotal=Rharness×[1k=1m(1Ragent,k×Rtool,k×Wk)]
其中:

  • RharnessR_{harness}Rharness:Harness层本身的可靠性(通常≥99.99%)
  • mmm:子任务的数量
  • Ragent,kR_{agent,k}Ragent,k:第k个子任务的Agent执行准确率
  • Rtool,kR_{tool,k}Rtool,k:第k个子任务调用的工具/业务系统的可靠性
  • WkW_kWk:第k个子任务的权重,核心子任务权重为1,非核心子任务权重为0.1-0.5

比如一个售后任务拆成4个子任务,每个子任务的Agent准确率是98%,工具可靠性是99.9%,Harness层可靠性是99.99%,那么整体任务成功率是:
Rtotal=0.9999×(1−(1−0.98×0.999)4)≈99.98% R_{total} = 0.9999 \times (1 - (1-0.98 \times 0.999)^4) \approx 99.98\% Rtotal=0.9999×(1(10.98×0.999)4)99.98%
完全达到业务生产的要求。

2. 最优任务调度公式

我们用动态规划计算最优的子任务执行顺序,最小化整体执行时间:
DP[i]=min⁡j∈Pre(i)(DP[j]+Cost(j,i)) DP[i] = \min_{j \in Pre(i)} (DP[j] + Cost(j,i)) DP[i]=jPre(i)min(DP[j]+Cost(j,i))
其中:

  • DP[i]DP[i]DP[i]:执行到第i个子任务的最小耗时
  • Pre(i)Pre(i)Pre(i):第i个子任务的所有前置依赖子任务
  • Cost(j,i)Cost(j,i)Cost(j,i):执行完第j个子任务后执行第i个子任务的耗时

项目实战:电商售后自动处理Agent落地

我们以电商售后场景为例,完整实现一个Harness层管控的、可以作为业务执行主体的售后处理Agent,以前这个场景是Copilot模式,客服一天处理100单,现在用Agent一天处理10万单,准确率98.5%,人工介入率仅3%。

开发环境搭建

  1. 基础环境:Python 3.10+
  2. 依赖安装:
pip install langgraph openai fastapi sqlalchemy pydantic python-dotenv
  1. 准备资源:OpenAI API Key、电商订单系统API权限、售后业务规则知识库

核心代码实现

import os
from typing import TypedDict, List
from langgraph.graph import StateGraph, END
from openai import OpenAI
import sqlite3

# 初始化客户端
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# 定义任务状态
class TaskState(TypedDict):
    user_id: str
    order_id: str
    user_request: str
    subtasks: List[dict]
    current_subtask: int
    execution_result: dict
    is_success: bool
    need_human: bool
    human_feedback: str

# ---------------------- Harness层核心模块 ----------------------
# 1. 任务拆解模块
def task_decomposition(state: TaskState) -> TaskState:
    """把用户的售后需求拆成标准子任务"""
    prompt = f"""
    你是电商售后任务拆解专家,根据用户的售后请求,拆成4-6个可执行的子任务,每个子任务包含id、name、description、rule(校验规则)。
    固定必须包含的子任务:1. 核验订单是否符合售后规则 2. 匹配售后解决方案 3. 执行售后操作 4. 通知用户结果。
    用户请求:{state['user_request']},订单ID:{state['order_id']}
    输出JSON格式,不要其他内容。
    """
    response = client.chat.completions.create(model="gpt-3.5-turbo", messages=[{"role":"user","content":prompt}])
    import json
    state['subtasks'] = json.loads(response.choices[0].message.content)
    state['current_subtask'] = 0
    return state

# 2. 权限校验模块
def permission_check(state: TaskState) -> TaskState:
    """校验Agent是否有权限执行当前子任务"""
    # 这里对接公司的权限系统,比如超过1000元的退款需要人工审核
    order_amount = get_order_amount(state['order_id'])
    if order_amount > 1000 and state['subtasks'][state['current_subtask']]['name'] == '执行退款':
        state['need_human'] = True
    return state

# 3. 子任务执行模块
def execute_subtask(state: TaskState) -> TaskState:
    """执行当前子任务"""
    subtask = state['subtasks'][state['current_subtask']]
    if subtask['name'] == '核验订单是否符合售后规则':
        # 对接订单系统查询订单信息
        order_info = get_order_info(state['order_id'])
        state['execution_result']['order_info'] = order_info
        state['is_success'] = order_info['is_after_sale_allowed']
    elif subtask['name'] == '匹配售后解决方案':
        # 匹配售后规则知识库
        solution = match_after_sale_rule(state['execution_result']['order_info'], state['user_request'])
        state['execution_result']['solution'] = solution
        state['is_success'] = True
    elif subtask['name'] == '执行售后操作':
        # 对接售后系统执行操作,比如同意退货、退款
        execute_result = execute_after_sale_operation(state['order_id'], state['execution_result']['solution'])
        state['execution_result']['execute_result'] = execute_result
        state['is_success'] = execute_result['success']
    elif subtask['name'] == '通知用户结果':
        # 给用户发通知
        send_notification(state['user_id'], state['execution_result']['solution'])
        state['is_success'] = True
    return state

# 4. 结果校验模块
def result_check(state: TaskState) -> TaskState:
    """校验子任务执行结果是否符合规则"""
    subtask = state['subtasks'][state['current_subtask']]
    # 先跑规则引擎校验
    rule_pass = run_rule_engine(subtask['rule'], state['execution_result'])
    if not rule_pass:
        state['is_success'] = False
        return state
    # 再跑RAG校验和历史案例匹配
    rag_pass = rag_check(subtask, state['execution_result'])
    state['is_success'] = rule_pass and rag_pass
    return state

# 5. 异常处理模块
def exception_handle(state: TaskState) -> TaskState:
    """处理执行失败的子任务"""
    subtask = state['subtasks'][state['current_subtask']]
    retry_count = subtask.get('retry_count', 0)
    if retry_count < 3:
        # 重试,重试次数+1
        state['subtasks'][state['current_subtask']]['retry_count'] = retry_count + 1
        return state
    else:
        # 重试3次失败,触发人工介入
        state['need_human'] = True
        return state

# ---------------------- 流程编排 ----------------------
def router(state: TaskState):
    """路由判断下一步执行什么"""
    if state['need_human']:
        return "human_intervention"
    if not state['is_success']:
        return "exception_handle"
    if state['current_subtask'] >= len(state['subtasks']) - 1:
        return END
    state['current_subtask'] += 1
    return "permission_check"

# 构建Harness流程图
workflow = StateGraph(TaskState)
# 添加节点
workflow.add_node("task_decomposition", task_decomposition)
workflow.add_node("permission_check", permission_check)
workflow.add_node("execute_subtask", execute_subtask)
workflow.add_node("result_check", result_check)
workflow.add_node("exception_handle", exception_handle)
workflow.add_node("human_intervention", lambda x: x) # 人工处理节点
# 编排边
workflow.set_entry_point("task_decomposition")
workflow.add_edge("task_decomposition", "permission_check")
workflow.add_edge("permission_check", "execute_subtask")
workflow.add_edge("execute_subtask", "result_check")
workflow.add_conditional_edges("result_check", router)
workflow.add_edge("exception_handle", "execute_subtask")
workflow.add_edge("human_intervention", "execute_subtask")
# 编译运行
app = workflow.compile()

# 测试运行
if __name__ == "__main__":
    initial_state = {
        "user_id": "12345",
        "order_id": "67890",
        "user_request": "我买的鞋子穿了一周开胶了,要退货",
        "subtasks": [],
        "current_subtask": 0,
        "execution_result": {},
        "is_success": False,
        "need_human": False,
        "human_feedback": ""
    }
    result = app.invoke(initial_state)
    print("售后任务处理完成,结果:", result['execution_result'])

代码解读

上面的代码就是一个最小化的Harness层实现:

  1. 所有的Agent执行都要经过Harness层的任务拆解、权限校验、结果校验、异常处理,不会直接对外输出
  2. 硬规则和大模型能力结合,既保留了大模型的灵活性,又保证了业务规则的严肃性
  3. 全链路留痕,所有执行步骤都可以存入审计日志,方便排查问题和合规
  4. 异常场景自动重试,重试失败才触发人工介入,最大程度降低人类参与度

实际应用场景 & 最佳实践

已经落地的典型场景

行业 场景 从Copilot到主体的变化 效率提升
互联网 售后工单处理 从Copilot给客服生成回复草稿,变成Agent自动处理97%的工单,只有3%的复杂工单需要人工 10倍
金融 财务报销处理 从Copilot给员工生成报销模板,变成Agent自动核验发票、匹配规则、打款,95%的报销单不需要人工审核 8倍
软件公司 代码开发 从Copilot生成代码片段,变成Agent自动完成需求拆解、编码、测试、上线,80%的常规需求不需要工程师参与 5倍
制造业 供应链调度 从Copilot给调度员出建议,变成Agent自动根据库存、物流、订单情况调整调度方案,90%的调度操作自动执行 6倍
政务 办事申请处理 从Copilot给市民做办事指引,变成Agent自动受理申请、核验材料、办理业务、通知结果,92%的常规事项全程自助 7倍

落地最佳实践

  1. 先从低风险、高标准化的场景切入:不要一开始就搞支付、医疗诊断等高风险场景,先从售后、报销、信息查询等场景入手,跑通流程再逐步扩展。
  2. 半自动化过渡,不要一步到位:先做「Agent执行+人工抽检」的模式,等准确率稳定在95%以上再逐步放开全自动化,避免对业务造成影响。
  3. 业务规则优先,大模型为辅:Harness层的规则一定要和业务部门对齐,硬规则必须100%执行,大模型只负责处理规则之外的柔性场景。
  4. 全链路审计日志必加:所有Agent的操作都要存日志,包括输入、输出、调用的工具、校验结果、异常情况,方便排查问题和合规审计。
  5. 快速回滚机制必备:如果Agent出问题,要能一键切回人工模式,不影响业务正常运行。

未来发展趋势与挑战

发展趋势(2024-2028年)

时间 Harness成熟度 核心能力 典型应用
2024年 2级 单场景Harness,支持任务拆解、校验、异常处理 单业务线的Agent执行主体
2025年 3级 跨场景Harness,支持多Agent协作、自动规则迭代 企业级统一Agent管控平台
2026年 4级 自适应Harness,自动适配业务规则、自主优化执行策略 行业通用Agent平台
2027-2028年 5级 通用Harness,支持多模态、跨域任务、自主进化 AGI的核心管控层

面临的挑战

  1. 可靠性挑战:怎么在复杂场景下把Agent的准确率做到99.99%以上,满足金融、医疗等高风险场景的要求。
  2. 合规挑战:Agent处理用户数据、执行业务操作怎么符合《个人信息保护法》《网络安全法》等法规的要求,尤其是跨境业务的合规。
  3. 可解释性挑战:Agent做出的决策怎么能给用户、监管机构解释清楚,避免黑箱问题。
  4. 人机协作挑战:怎么设计合理的人机交互机制,让Agent和人类无缝配合,而不是互相干扰。

总结:学到了什么?

核心概念回顾

  1. AI Agent Harness Engineering:给AI Agent装的安全操作系统,通过任务拆解、校验、容错、管控体系,把大模型的不确定性变成可控的业务执行能力。
  2. Copilot模式:AI是辅助,人类是主导,全程参与任务,效率提升有限。
  3. 业务执行主体模式:AI是主力,人类只做兜底,端到端完成任务,效率提升10倍以上。
  4. Harness层:夹在大模型和业务系统之间的中间管控层,是Harness Engineering的核心载体。

关键结论

  1. 大模型不是不够聪明,而是缺少可控的管控体系,导致无法成为业务执行主体。
  2. Harness Engineering是LLM落地生产的核心,没有Harness层的Agent只能是玩具,不能用到正式业务里。
  3. 落地Harness Engineering不需要从零开始,现在有很多开源框架(LangGraph、AgentScope、Dify等)可以直接用,成本很低。

思考题:动动小脑筋

  1. 你所在的行业有哪些现在是Copilot模式的业务,可以改造成Agent业务执行主体模式?改造的难点是什么?
  2. 如果让你设计一个面向中小学的作业批改Agent的Harness层,你会加哪些核心规则和校验机制?

附录:常见问题与解答

Q:AI Agent作为业务执行主体会不会抢人类的工作?
A:不会,它只会把人类从重复、枯燥、低价值的劳动里解放出来,让人类做更有创造力的工作,比如客服从每天回100个重复问题,变成只处理复杂的客户投诉,反而能提升工作价值。

Q:Harness Engineering和普通的Agent编排有什么区别?
A:普通的Agent编排只是把工具调用的步骤串起来,而Harness Engineering是整套工程体系,包含了权限管控、结果校验、异常处理、合规审计全链路,核心是保障可靠性和可控性。

Q:中小公司落地Harness Engineering的成本高吗?
A:不高,现在有很多开源的Harness框架,比如LangGraph、AgentScope,只要有一个懂Python的工程师,花1-2周就能搭出一个最小可用的Harness层,跑通单个业务场景。


扩展阅读 & 参考资料

  1. OpenAI官方文档:《Agent Harness Best Practices》
  2. LangGraph官方文档:https://langchain-ai.github.io/langgraph/
  3. 吴恩达《AI Agent开发专项课程》
  4. GitHub Awesome AI Agent列表:https://github.com/e2b-dev/awesome-ai-agents
  5. 《AI Agent落地实战指南》书籍
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐