企业部署 AI Agent Harness Engineering 的三种模式:嵌入式、API 式与混合式

关键词:AI Agent、Harness Engineering、企业部署模式、嵌入式Agent、API式Agent、混合式Agent、工程化最佳实践

摘要:AI Agent(智能体)正在从实验室走向企业生产环境,成为企业数字化转型的“超级员工”。但如何像管理传统软件一样标准化、可复用、可扩展、高可靠地批量部署 AI Agent,成了当前企业面临的核心痛点——这就是Harness Engineering(智能体工程化)需要解决的问题。本文用“给企业招超级实习生”的生动比喻,结合大量技术细节、Python 代码实战、Mermaid 架构图、数学模型、行业最佳实践,从问题背景、核心概念、问题解决(三种部署模式的全流程解析)、边界与外延、未来趋势等维度,一步一步拆解企业部署 AI Agent Harness Engineering 的完整方案。无论你是 CTO、架构师、AI 算法工程师还是产品经理,读完本文都能找到适合自己企业的部署路径。


背景介绍:企业为什么要做 AI Agent Harness Engineering?

0.1 故事引入:从“天才程序员小明”到“批量标准化的超级实习生团队”

假设你是一家电商公司的 CTO,最近挖到了一个叫“小明”的“全栈天才程序员+资深运营+金牌客服”——他就是你们公司训练的第一个 AI Agent!

  • 天才小明刚入职第一天就搞定了三件事:① 自动分析用户画像并生成 10000 条个性化商品推荐文案;② 帮客服团队自动处理了 90% 的常见投诉,响应时间从 1 小时降到 5 秒;③ 凌晨 3 点发现服务器异常,自动触发扩容脚本并修复了问题。
  • 你开心坏了,立刻拍板:“给我再招 1000 个这样的小明!”——但当你真的开始“批量招聘小明”时,才发现噩梦来了:
    1. 小明太多,管理不住:有的小明写文案太激进,违反广告法;有的小明处理投诉太软弱,让用户薅了羊毛;有的小明触发扩容脚本太频繁,每月服务器成本涨了 3 倍;
    2. 小明的能力参差不齐:第一个小明是“全栈天才”,第二个可能只会写美妆文案,第三个只会处理家电投诉;你没法快速给“特定岗位的小明”分配特定的技能包;
    3. 小明的“寿命”太短:平台规则变了(比如淘宝新出的广告法),小明写的文案立刻失效;你得重新训练新的小明,成本高、周期长;
    4. 小明和现有系统“合不来”:小明只能看懂你们新开发的 SaaS 系统,看不懂老的 ERP、CRM、WMS——要让他融入,得重构所有老系统,成本太高;
    5. 小明会“闯祸”:万一某个黑客入侵了小明的“大脑”(大模型 API 或者知识库),让他给用户发诈骗短信、删除公司数据怎么办?

这时候你才意识到:“招单个天才小明”靠的是“AI 炼金术”(算法调优),但“批量招、管得住、用得好、闯不了大祸的超级实习生团队”,靠的是“AI 工程学”——也就是我们今天要讲的「AI Agent Harness Engineering」

0.2 问题背景:AI Agent 从“实验室原型”到“企业生产级应用”的三大鸿沟

0.2.1 第一大鸿沟:“原型验证容易” vs “批量生产困难”

目前,全球有超过 1000 款 AI Agent 开发框架(比如 LangChain、AutoGPT、CrewAI、LlamaIndex),任何一个算法工程师都能在 1 天内用 LangChain + GPT-4 搭出一个“原型级 AI Agent”。但根据 Gartner 2024 年的最新报告,全球只有不到 5% 的原型级 AI Agent 能够成功部署到企业生产环境——剩下的 95% 要么在“试用阶段就夭折”,要么在“上线后半年内就下线”。
为什么会这样?因为“原型验证”只需要考虑“能不能用”,但“批量生产”需要考虑:

  • 标准化:如何给 AI Agent 定义统一的“入职标准”(能力模型、接口规范、安全规范)?
  • 可复用:如何把 AI Agent 的“大脑”(大模型)、“眼睛”(知识库)、“手”(工具链)、“脚”(部署环境)拆成“可插拔的组件”,快速组装出“特定岗位的超级实习生”?
  • 可扩展:当用户数量从 1000 涨到 100 万时,如何让 AI Agent 团队的性能不下降?
  • 高可靠:当某个大模型 API 挂掉时,如何让 AI Agent 自动切换到备用模型?当某个 AI Agent 犯错误时,如何让“监督岗的 AI Agent”(Guardian Agent)自动发现并纠正?
  • 低成本:如何降低 AI Agent 的部署成本、训练成本、运维成本?
0.2.2 第二大鸿沟:“AI 团队自己玩” vs “业务团队一起用”

目前,大多数企业的 AI Agent 都是由“AI 算法团队”主导开发的——业务团队(比如运营、客服、供应链)只能“被动试用”,无法“主动定制”。但根据 McKinsey 2024 年的最新报告,只有当业务团队深度参与 AI Agent 的开发和部署时,AI Agent 才能为企业带来真正的 ROI(投资回报率)
为什么会这样?因为“AI 团队”懂技术,但不懂业务;“业务团队”懂业务,但不懂技术——双方之间存在“技术-业务鸿沟”。比如:

  • 运营团队想让 AI Agent 自动分析抖音上的美妆视频,生成带“热点关键词”的商品推荐文案——但 AI 团队可能不知道“抖音美妆热点关键词的更新频率是每天一次”,也不知道“哪些热点关键词是‘合规的’(不会违反广告法)”;
  • 客服团队想让 AI Agent 自动处理“退款申请”——但 AI 团队可能不知道“退款申请的流程是:先核对用户订单,再检查商品是否在退款期内,最后生成退款单并同步到 ERP 系统”,也不知道“哪些退款申请需要人工审核(比如金额超过 1000 元的)”。
0.2.3 第三大鸿沟:“AI Agent 单独工作” vs “AI Agent 与人类、传统系统协同工作”

目前,大多数企业的 AI Agent 都是“单独工作”的——要么“在 SaaS 平台上单独用”,要么“作为传统系统的‘外挂插件’偶尔用”。但根据 IDC 2024 年的最新报告,未来 3 年,企业 80% 的工作将由“AI Agent + 人类 + 传统系统”组成的“混合团队”完成
为什么会这样?因为“单独工作的 AI Agent”能力有限——比如:

  • AI Agent 可以自动处理 90% 的常见投诉,但剩下的 10% 复杂投诉(比如“用户买了电视,用了 1 个月后屏幕坏了,要求赔偿 2 倍金额”),还是需要人类客服处理;
  • AI Agent 可以自动生成 10000 条个性化商品推荐文案,但最终哪些文案能上线,还是需要运营主管审核;
  • AI Agent 可以自动分析用户订单,但最终生成的退款单还是需要同步到老的 ERP 系统——如果老的 ERP 系统是用 COBOL 写的,没有 API 接口,那 AI Agent 根本没法和它协同。

0.3 问题描述:AI Agent Harness Engineering 到底要解决什么问题?

在讲“AI Agent Harness Engineering 的三种模式”之前,我们首先要明确:什么是 AI Agent?什么是 Harness Engineering?AI Agent Harness Engineering 到底要解决什么问题?

0.3.1 什么是 AI Agent?(像给小学生讲故事一样)

AI Agent 就像企业里的“超级实习生”——他有“大脑”(大模型,比如 GPT-4o、Claude 3.5 Sonnet、Llama 3.1)来思考和决策,有“眼睛”(知识库,比如企业内部的文档库、CRM 库、WMS 库)来获取信息,有“手”(工具链,比如 Python 脚本、API 接口、浏览器插件)来执行任务,有“脚”(部署环境,比如 Docker 容器、Kubernetes 集群、云服务器)来移动和工作,还有“耳朵”和“嘴巴”(对话界面,比如 Slack、微信、钉钉、企业自研的 SaaS 平台)来和人类、其他 AI Agent 交流。

0.3.2 什么是 Harness Engineering?(像给小学生讲故事一样)

Harness Engineering 就像企业里的“超级实习生管理系统”+“超级实习生培训学院”+“超级实习生考核体系”+“超级实习生安全保障体系”——它的核心目标是:

  1. 批量标准化招聘超级实习生:不用每次都“从头培养”,而是从“可插拔的组件库”里快速组装出“特定岗位的超级实习生”;
  2. 让业务团队一起参与培训和管理:不用懂技术,业务团队就能通过“可视化拖拽界面”给超级实习生分配任务、设置规则、添加工具;
  3. 让超级实习生、人类、传统系统协同工作:给超级实习生安排“人类导师”和“传统系统对接员”,让混合团队高效协作;
  4. 让超级实习生闯不了大祸:给超级实习生设置“防火墙”(安全规范)、“监督岗”(Guardian Agent)、“紧急刹车”(应急响应机制);
  5. 持续提升超级实习生的能力:通过“反馈闭环”,让人类导师、用户、其他系统的反馈持续优化超级实习生的“大脑”和“技能包”。
0.3.3 AI Agent Harness Engineering 的核心问题列表(结构化思考)

根据前面的故事和背景,我们可以把 AI Agent Harness Engineering 的核心问题总结为“5W2H”模型:

  • Who(谁用?):AI 算法工程师、业务团队(运营、客服、供应链等)、IT 运维人员、CTO/架构师;
  • What(做什么?):组件化开发 AI Agent、批量部署 AI Agent、标准化管理 AI Agent、安全保障 AI Agent、反馈优化 AI Agent;
  • When(什么时候用?):当企业需要“批量标准化部署 AI Agent”时;当企业需要“业务团队深度参与 AI Agent 开发”时;当企业需要“AI Agent 与人类、传统系统协同工作”时;
  • Where(在哪里用?):可以部署在公有云(比如 AWS、Azure、阿里云)、私有云(比如企业自建的 OpenStack、VMware)、混合云(既有公有云又有私有云),也可以部署在边缘设备(比如工厂里的机器人、仓库里的 PDA);
  • Why(为什么用?):为了跨越“原型验证-批量生产”、“AI 团队-业务团队”、“单独工作-协同工作”三大鸿沟,为企业带来真正的 ROI;
  • How(怎么用?):这就是我们今天要讲的重点——嵌入式、API 式、混合式三种部署模式
  • How much(成本多少?):我们会在后面的“边界与外延”章节详细对比三种部署模式的成本。

0.4 预期读者

本文适合以下人群阅读:

  1. CTO/架构师:想了解 AI Agent Harness Engineering 的整体架构和技术选型;
  2. AI 算法工程师:想学习 AI Agent 组件化开发、批量部署、反馈优化的具体技术细节;
  3. 业务团队负责人:想了解如何深度参与 AI Agent 的开发和部署,如何让 AI Agent 为自己的业务带来 ROI;
  4. IT 运维人员:想了解如何标准化管理、安全保障、监控运维 AI Agent;
  5. AI 产品经理:想了解如何设计 AI Agent Harness Engineering 平台的产品功能。

0.5 文档结构概述(像玩游戏的“关卡地图”一样)

本文的结构就像“玩一个超级实习生管理系统的通关游戏”:

  1. 第一关:新手村(背景介绍):了解为什么要做 AI Agent Harness Engineering,它要解决什么问题;
  2. 第二关:技能学习(核心概念与联系):学习 AI Agent、Harness Engineering、三种部署模式的核心概念,以及它们之间的关系;
  3. 第三关:基础模式(嵌入式部署模式):学习如何把 AI Agent 嵌入到企业现有的系统里,适合“只想给现有系统加个 AI 功能”的企业;
  4. 第四关:进阶模式(API 式部署模式):学习如何把 AI Agent 部署成独立的 API 服务,适合“想让多个系统共用同一个 AI Agent 团队”的企业;
  5. 第五关:高级模式(混合式部署模式):学习如何结合嵌入式和 API 式的优点,适合“业务场景复杂、既有老系统又有新系统”的企业;
  6. 第六关:装备升级(工具和资源推荐):了解 AI Agent Harness Engineering 领域的主流工具和资源;
  7. 第七关:未来展望(未来发展趋势与挑战):了解 AI Agent Harness Engineering 领域的未来发展趋势和挑战;
  8. 第八关:通关总结(总结):回顾本文的核心内容;
  9. 第九关:挑战关卡(思考题):鼓励读者进一步思考和应用所学知识;
  10. 第十关:隐藏关卡(附录):解答常见问题,推荐扩展阅读和参考资料。

0.6 术语表

0.6.1 核心术语定义
核心术语 通俗易懂的定义(给小学生) 专业定义(给技术人员)
AI Agent 企业里的“超级实习生”,有大脑、眼睛、手、脚、耳朵和嘴巴 一种能够感知环境、自主决策、执行任务、并与其他智能体/人类交互的智能系统,通常由大模型(LLM)、知识库(RAG)、工具链(Tool Calling)、部署环境、交互界面五部分组成
Harness Engineering 企业里的“超级实习生管理系统+培训学院+考核体系+安全保障体系” 一种用于标准化、可复用、可扩展、高可靠、低成本地批量开发、部署、管理、监控、优化 AI Agent 的工程化方法和技术体系
嵌入式部署模式 把“超级实习生”直接安排在“老办公室”(现有系统)里,让他和老员工(现有系统的功能)一起工作 把 AI Agent 的核心逻辑(LLM、RAG、Tool Calling)直接嵌入到企业现有的软件系统(比如 ERP、CRM、WMS、SaaS 平台)的代码库中,作为现有系统的一个“内部模块”运行
API 式部署模式 把“超级实习生团队”安排在“独立办公楼”(独立的服务集群)里,让“老办公室”(现有系统)、“新办公室”(新开发的系统)、“人类员工”(通过对话界面)都可以通过“电话/传真”(API 接口)找他们帮忙 把 AI Agent 的核心逻辑部署成独立的、可扩展的 API 服务集群,企业现有的系统、新开发的系统、人类用户都可以通过标准化的 API 接口调用这些服务
混合式部署模式 把一部分“超级实习生”安排在“老办公室”(现有系统)里,把另一部分“超级实习生团队”安排在“独立办公楼”(独立的服务集群)里,让两者协同工作 结合嵌入式和 API 式的优点,把一部分 AI Agent 嵌入到企业现有系统中(处理对响应速度要求极高、数据安全性要求极高的任务),把另一部分 AI Agent 部署成独立的 API 服务集群(处理对复用性要求极高、扩展性要求极高的任务)
0.6.2 相关概念解释
相关概念 通俗易懂的定义(给小学生) 专业定义(给技术人员)
LLM(大语言模型) 超级实习生的“大脑”,会思考、会说话、会写东西 一种基于 Transformer 架构的预训练语言模型,具有强大的自然语言理解、生成、推理能力,比如 GPT-4o、Claude 3.5 Sonnet、Llama 3.1
RAG(检索增强生成) 超级实习生的“眼睛+图书馆”,让他可以从图书馆(企业内部知识库)里找资料,回答问题时不会“胡编乱造” 一种将信息检索(IR)和文本生成(NLG)结合起来的技术,首先从知识库中检索出与用户问题相关的文档片段,然后将这些片段和用户问题一起输入到 LLM 中,生成更准确、更可靠的答案
Tool Calling(工具调用) 超级实习生的“手+工具箱”,让他可以使用各种工具(比如 Python 脚本、API 接口、浏览器插件)来执行任务 一种让 LLM 能够自动调用外部工具(比如搜索引擎、计算器、数据库、API 接口)的技术,扩展了 LLM 的能力边界,让它可以处理更复杂的任务
Guardian Agent(监督岗智能体) 超级实习生的“主管”,负责监督超级实习生的工作,发现错误及时纠正 一种专门用于监控、审核、纠正其他 AI Agent 的智能体,通常负责检查 AI Agent 的输出是否符合安全规范、伦理规范、业务规范
Feedback Loop(反馈闭环) 超级实习生的“培训机制”,让他可以从人类导师、用户、其他系统的反馈中持续学习,提升能力 一种将 AI Agent 的输出、人类/系统的反馈、模型的优化训练结合起来的循环机制,是提升 AI Agent 性能的核心
0.6.3 缩略词列表
缩略词 全称 中文翻译
AI Artificial Intelligence 人工智能
LLM Large Language Model 大语言模型
RAG Retrieval-Augmented Generation 检索增强生成
API Application Programming Interface 应用程序编程接口
SaaS Software as a Service 软件即服务
ERP Enterprise Resource Planning 企业资源计划
CRM Customer Relationship Management 客户关系管理
WMS Warehouse Management System 仓库管理系统
Docker - 一种开源的容器化平台
Kubernetes - 一种开源的容器编排平台,简称 K8s
ROI Return on Investment 投资回报率
Gartner - 全球最权威的 IT 研究与咨询公司之一
McKinsey - 全球最权威的管理咨询公司之一
IDC International Data Corporation 国际数据公司

核心概念与联系:三种部署模式的本质是什么?它们之间有什么区别?

1.1 故事引入:从“给老办公室装空调”到“建独立的中央空调系统”

让我们继续用“超级实习生”的比喻,来理解三种部署模式的本质:
假设你是一家公司的行政主管,公司有两种办公室:

  1. 老办公室:已经有 10 年历史了,房间格局固定,没有预留空调外机的位置,只能装“窗式空调”;
  2. 新办公室:刚建好不久,房间格局灵活,预留了中央空调的管道,可以装“中央空调”;

现在,公司要解决“夏天太热、冬天太冷”的问题——这就像企业要解决“现有系统没有 AI 功能、新系统需要 AI 功能、多个系统需要共用 AI 功能”的问题。

你有三种解决方案:

  1. 方案一:给每个老办公室单独装窗式空调——这就是我们今天要讲的嵌入式部署模式
    • 优点:安装速度快,不需要改老办公室的格局,成本低(只需要买窗式空调的钱);
    • 缺点:每个窗式空调只能给一个老办公室用,无法复用;窗式空调的制冷/制热效果有限,无法满足大房间的需求;需要单独管理每个窗式空调(比如开关、温度调节、维修),管理成本高;
  2. 方案二:建一个独立的中央空调系统,给所有老办公室和新办公室都装中央空调的出风口——这就是我们今天要讲的API 式部署模式
    • 优点:中央空调可以给所有办公室用,复用性高;中央空调的制冷/制热效果好,扩展性强(再建 10 个新办公室也没问题);只需要管理一个中央空调系统,管理成本低;
    • 缺点:安装速度慢,需要给老办公室改格局(装中央空调的管道),成本高(需要买中央空调主机、管道、出风口的钱);如果中央空调主机坏了,所有办公室都没有空调用,可靠性低;
  3. 方案三:给一部分对温度要求极高、房间格局无法改的老办公室单独装窗式空调,给其他老办公室和所有新办公室装中央空调的出风口——这就是我们今天要讲的混合式部署模式
    • 优点:结合了方案一和方案二的优点,既满足了“对温度要求极高、房间格局无法改的老办公室”的需求,又满足了“复用性、扩展性、管理成本低”的需求;
    • 缺点:需要同时管理窗式空调和中央空调,管理复杂度比方案一和方案二高;

通过这个比喻,你是不是已经对三种部署模式的本质有了一个初步的了解?接下来,我们会用更专业的语言,详细讲解三种部署模式的核心概念、区别、联系。

1.2 核心概念解释(专业定义+小学生比喻)

1.2.1 核心概念一:嵌入式部署模式
  • 专业定义:把 AI Agent 的核心逻辑(LLM、RAG、Tool Calling、Guardian Agent 等)直接嵌入到企业现有的软件系统(比如 ERP、CRM、WMS、SaaS 平台)的代码库中,作为现有系统的一个“内部模块”运行——AI Agent 和现有系统共享同一个进程、同一个内存空间、同一个数据库连接、同一个部署环境。
  • 小学生比喻:给每个老办公室单独装窗式空调——窗式空调和老办公室的墙壁是“连在一起”的,共用同一个电源插座、同一个窗户(作为外机的通风口),不需要额外的管道。
1.2.2 核心概念二:API 式部署模式
  • 专业定义:把 AI Agent 的核心逻辑部署成独立的、可扩展的 API 服务集群(通常用 Docker 容器化、Kubernetes 编排),企业现有的系统、新开发的系统、人类用户都可以通过标准化的 API 接口(比如 REST API、GraphQL API、gRPC API)调用这些服务——AI Agent 和现有系统是“分离的”,它们通过网络进行通信,不共享进程、内存空间、数据库连接、部署环境。
  • 小学生比喻:建一个独立的中央空调系统——中央空调主机放在“独立机房”里,通过管道连接到所有老办公室和新办公室的出风口,所有办公室都可以通过“遥控器”(API 接口)调节温度,不需要共用同一个电源插座、同一个窗户。
1.2.3 核心概念三:混合式部署模式
  • 专业定义:结合嵌入式和 API 式的优点,根据业务场景的不同,把 AI Agent 分成两类:
    1. 本地 Agent:嵌入到企业现有系统中,处理**对响应速度要求极高(毫秒级)、数据安全性要求极高(数据不能离开企业内网)、业务逻辑非常固定(不需要频繁更新)**的任务;
    2. 云端/集群 Agent:部署成独立的 API 服务集群,处理**对复用性要求极高(多个系统共用)、扩展性要求极高(用户数量波动大)、业务逻辑需要频繁更新(比如根据热点更新推荐文案)、需要调用外部大模型/外部工具(比如 OpenAI GPT-4o、Google Search API)**的任务;
  • 小学生比喻:给一部分对温度要求极高、房间格局无法改的老办公室单独装窗式空调,给其他老办公室和所有新办公室装中央空调的出风口——既满足了特殊需求,又兼顾了整体效率。

1.3 核心概念之间的关系(属性对比+ER 架构图+交互关系图)

1.3.1 概念核心属性维度对比(markdown 表格)

为了更清晰地对比三种部署模式的区别,我们从部署复杂度、响应速度、数据安全性、复用性、扩展性、管理成本、适用场景7 个核心属性维度进行对比:

核心属性维度 嵌入式部署模式 API 式部署模式 混合式部署模式
部署复杂度 低(只需要修改现有系统的代码库,不需要额外的容器化/编排工作) 高(需要设计 API 接口、容器化 Agent、搭建 K8s 集群、配置负载均衡/监控/告警) 中高(需要同时处理嵌入式和 API 式的部署工作,管理复杂度比前两者高)
响应速度 极快(共享内存空间/数据库连接,不需要网络通信,延迟通常在毫秒级) 较慢(需要通过网络进行 API 调用,延迟通常在几十毫秒到几秒之间,取决于网络状况和服务集群的性能) 快(本地 Agent 处理极快,云端 Agent 处理较慢,根据业务场景分配任务,整体响应速度满足需求)
数据安全性 极高(数据不需要离开企业内网/现有系统的数据库,不需要通过网络传输) 中高(如果把 Agent 部署在私有云/企业内网,数据安全性较高;如果部署在公有云,需要使用加密传输(HTTPS/TLS)、加密存储(AES-256)等技术保障数据安全) 极高(本地 Agent 处理敏感数据,不需要离开企业内网;云端 Agent 处理非敏感数据,或者通过加密技术保障数据安全)
复用性 极低(每个 Agent 只能嵌入到一个现有系统中,无法复用;如果要给另一个系统加同样的 AI 功能,需要重新开发/复制代码) 极高(所有系统、人类用户都可以通过标准化的 API 接口调用同一个 Agent 服务集群,复用性非常高) 高(本地 Agent 复用性低,但可以把本地 Agent 的核心逻辑抽象成可复用的组件;云端 Agent 复用性高,所有系统都可以调用)
扩展性 极低(和现有系统共享同一个部署环境,现有系统的扩展性决定了 Agent 的扩展性;如果现有系统无法扩展,Agent 也无法扩展) 极高(用 K8s 编排容器化的 Agent,可以根据用户数量/任务量自动扩缩容;再增加 100 个系统/100 万用户也没问题) 高(本地 Agent 扩展性低,但可以根据业务场景增加本地 Agent 的数量;云端 Agent 扩展性极高,可以自动扩缩容)
管理成本 高(每个 Agent 都嵌入在不同的现有系统中,需要单独管理、单独更新、单独监控;如果有 100 个系统,就需要管理 100 个 Agent) 低(只需要管理一个 Agent 服务集群,统一更新、统一监控、统一告警;管理成本非常低) 中(需要同时管理本地 Agent 和云端 Agent,管理复杂度比前两者高,但可以通过统一的 Harness Engineering 平台降低管理成本)
适用场景 1. 只想给单个现有系统加个 AI 功能;
2. 业务场景对响应速度要求极高(比如工厂里的机器人控制、金融交易系统的风险识别);
3. 业务场景对数据安全性要求极高(比如医院的病历管理系统、银行的客户信息管理系统);
4. 现有系统是老系统,没有预留 API 接口,无法改造成调用云端 Agent 的模式;
1. 想让多个系统/人类用户共用同一个 AI Agent 团队
2. 业务场景对复用性要求极高(比如个性化商品推荐、客服机器人、内容生成);
3. 业务场景对扩展性要求极高(比如双 11 期间的客服机器人、用户数量波动大的 SaaS 平台);
4. 业务逻辑需要频繁更新(比如根据热点更新推荐文案、根据平台规则更新投诉处理流程);
5. 需要调用外部大模型/外部工具(比如 OpenAI GPT-4o、Google Search API、Weather API);
1. 业务场景复杂,既有对响应速度/数据安全性要求极高的任务,又有对复用性/扩展性要求极高的任务;
2. 企业既有老系统(没有预留 API 接口),又有新系统(预留了 API 接口);
3. 企业想逐步迁移到 API 式部署模式,先给一部分系统加嵌入式 Agent,再逐步把其他系统迁移到云端 Agent;
1.3.2 概念联系的 ER 实体关系架构图(Mermaid)

为了更清晰地展示三种部署模式、Harness Engineering 平台、AI Agent 组件、企业系统、人类用户之间的实体关系,我们画了一个 Mermaid ER 架构图:

管理

管理

管理

管理

管理

管理

被使用

被使用

嵌入

调用API

调用API/对话界面

监督

监督

提供反馈

提供反馈

接收反馈

接收反馈

HarnessEngineeringPlatform

string

platform_id

PK

string

platform_name

string

deployment_mode

date

created_at

date

updated_at

AIAgentComponentLibrary

string

component_id

PK

string

component_name

string

component_type

string

component_description

string

component_version

date

created_at

date

updated_at

LocalAIAgent

string

agent_id

PK

string

agent_name

string

agent_role

string

embedded_system_id

FK

string[]

used_component_ids

FK

date

created_at

date

updated_at

CloudAIAgentCluster

string

cluster_id

PK

string

cluster_name

string

cloud_provider

string

k8s_version

string[]

used_component_ids

FK

date

created_at

date

updated_at

CloudAIAgent

string

agent_id

PK

string

agent_name

string

agent_role

string

cluster_id

FK

string[]

used_component_ids

FK

date

created_at

date

updated_at

EnterpriseSystem

string

system_id

PK

string

system_name

string

system_type

string

system_language

boolean

has_api

date

created_at

date

updated_at

HumanUser

string

user_id

PK

string

user_name

string

user_role

string

user_department

date

created_at

date

updated_at

GuardianAgent

string

guardian_id

PK

string

guardian_name

string

guardian_role

string[]

monitored_agent_ids

FK

date

created_at

date

updated_at

FeedbackLoop

string

feedback_id

PK

string

feedback_type

string

feedback_content

string

feedback_source_id

FK

string

feedback_source_type

string

target_agent_id

FK

date

created_at

date

updated_at

1.3.3 三种部署模式的交互关系图(Mermaid)

为了更清晰地展示三种部署模式下,AI Agent、企业系统、人类用户、Harness Engineering 平台之间的交互流程,我们分别画了三个 Mermaid 交互关系图:

1.3.3.1 嵌入式部署模式的交互关系图
Harness Engineering平台 反馈闭环 监督岗AI Agent 企业内部工具链 企业内部知识库 本地AI Agent(嵌入在ES中) 企业现有系统 人类用户 Harness Engineering平台 反馈闭环 监督岗AI Agent 企业内部工具链 企业内部知识库 本地AI Agent(嵌入在ES中) 企业现有系统 人类用户 发起业务请求(比如生成退款申请) 调用本地AI Agent处理请求 从内部知识库检索相关信息(比如退款规则) 返回相关信息 调用内部工具链执行任务(比如核对订单、检查退款期) 返回执行结果 把初步处理结果发给监督岗检查 返回检查结果(通过/不通过+修改建议) 返回最终处理结果 返回业务结果 提供反馈(比如满意/不满意+建议) 提供反馈(比如任务执行成功/失败+日志) 把反馈同步到平台 根据反馈优化本地AI Agent
1.3.3.2 API 式部署模式的交互关系图
Harness Engineering平台 反馈闭环 监督岗AI Agent(云端/私有云) 外部工具链(比如OpenAI GPT-4o、Google Search) 企业内部工具链(云端/私有云) 企业内部知识库(云端/私有云) 云端AI Agent3(数据分析) 云端AI Agent2(内容生成) 云端AI Agent1(客服机器人) 云端AI Agent集群(K8s编排) 负载均衡器 企业新开发的系统 企业现有系统2(有API接口) 企业现有系统1(有API接口) 人类用户 Harness Engineering平台 反馈闭环 监督岗AI Agent(云端/私有云) 外部工具链(比如OpenAI GPT-4o、Google Search) 企业内部工具链(云端/私有云) 企业内部知识库(云端/私有云) 云端AI Agent3(数据分析) 云端AI Agent2(内容生成) 云端AI Agent1(客服机器人) 云端AI Agent集群(K8s编排) 负载均衡器 企业新开发的系统 企业现有系统2(有API接口) 企业现有系统1(有API接口) 人类用户 通过对话界面发起请求(比如处理投诉) 把请求转发给云端AI Agent集群 把请求分配给空闲的客服机器人 从内部知识库检索相关信息(比如投诉处理流程) 返回相关信息 调用内部工具链执行任务(比如核对用户信息) 返回执行结果 把初步处理结果发给监督岗检查 返回检查结果 返回最终处理结果 返回业务结果 通过REST API发起请求(比如生成推荐文案) 把请求转发给云端AI Agent集群 把请求分配给空闲的内容生成Agent 从内部知识库检索相关信息(比如商品信息、用户画像) 返回相关信息 调用外部工具链(比如OpenAI GPT-4o生成文案、Google Search找热点) 返回执行结果 把初步处理结果发给监督岗检查 返回检查结果 返回最终处理结果 返回业务结果 提供反馈 提供反馈 提供反馈 提供反馈 把反馈同步到平台 根据反馈优化云端AI Agent集群 优化CA1 优化CA2 优化CA3
1.3.3.3 混合式部署模式的交互关系图
Harness Engineering平台 反馈闭环 云端监督岗AI Agent(私有云) 本地监督岗AI Agent(嵌入在ES1中) 外部工具链(比如OpenAI GPT-4o) 企业内部工具链(私有云) 企业内部知识库(私有云) 云端AI Agent 云端AI Agent集群(K8s编排) 负载均衡器 本地AI Agent(嵌入在ES1中) 企业新开发的系统 企业现有新系统(有API接口) 企业现有老系统(无API接口,嵌入本地Agent) 人类用户 Harness Engineering平台 反馈闭环 云端监督岗AI Agent(私有云) 本地监督岗AI Agent(嵌入在ES1中) 外部工具链(比如OpenAI GPT-4o) 企业内部工具链(私有云) 企业内部知识库(私有云) 云端AI Agent 云端AI Agent集群(K8s编排) 负载均衡器 本地AI Agent(嵌入在ES1中) 企业新开发的系统 企业现有新系统(有API接口) 企业现有老系统(无API接口,嵌入本地Agent) 人类用户 发起敏感/极速业务请求(比如金融交易风险识别) 调用本地AI Agent处理请求 从私有云知识库检索相关信息(极速专线) 返回相关信息 调用私有云工具链执行任务(极速专线) 返回执行结果 把初步处理结果发给本地监督岗检查 返回检查结果 返回最终处理结果(毫秒级) 返回业务结果 发起非敏感/复用/扩展业务请求(比如生成营销文案) 把请求转发给云端AI Agent集群 把请求分配给空闲的云端AI Agent 从私有云知识库检索相关信息 返回相关信息 调用外部工具链(比如OpenAI GPT-4o生成文案) 返回执行结果 把初步处理结果发给云端监督岗检查 返回检查结果 返回最终处理结果 返回业务结果 发起协同业务请求(比如生成带风险评估的营销文案) 调用本地AI Agent处理风险评估 把风险评估结果发给本地监督岗检查 返回检查结果 返回风险评估结果 把风险评估结果和营销文案请求一起发给云端Agent 把请求转发给云端AI Agent集群 把请求分配给空闲的云端AI Agent 调用外部工具链生成带风险提示的营销文案 返回执行结果 把初步处理结果发给云端监督岗检查 返回检查结果 返回最终处理结果 返回最终处理结果 返回业务结果 提供反馈 提供反馈 提供反馈 提供反馈 把反馈同步到平台 根据反馈优化本地AI Agent 根据反馈优化云端AI Agent集群

1.4 核心概念原理和架构的文本示意图(专业定义)

为了更清晰地展示 AI Agent Harness Engineering 的整体架构和三种部署模式的原理,我们画了一个文本示意图:

┌───────────────────────────────────────────────────────────────────────────────────────────────┐
│                                   AI Agent Harness Engineering 平台                               │
├───────────────────────────────────────────────────────────────────────────────────────────────┤
│  ┌──────────────┐  ┌──────────────┐  ┌──────────────┐  ┌──────────────┐  ┌──────────────┐ │
│  │ 组件化开发平台 │  │ 批量部署平台   │  │ 标准化管理平台 │  │ 安全保障平台   │  │ 反馈优化平台   │ │
│  │ - 可视化拖拽  │  │ - 嵌入式部署   │  │ - 统一监控     │  │ - 数据加密     │  │ - 反馈收集     │ │
│  │ - 组件库管理  │  │ - API式部署    │  │ - 统一告警     │  │ - 权限控制     │  │ - 反馈分析     │ │
│  │ - 代码生成    │  │ - 混合式部署    │  │ - 统一更新     │  │ - 内容审核     │  │ - 模型微调     │ │
│  │ - 测试验证    │  │ - 容器化编排   │  │ - 统一计费     │  │ - 应急响应     │  │ - 组件更新     │ │
│  └──────────────┘  └──────────────┘  └──────────────┘  └──────────────┘  └──────────────┘ │
├───────────────────────────────────────────────────────────────────────────────────────────────┤
│  ┌───────────────────────────────────────────────────────────────────────────────────────────┐  │
│  │                                      AI Agent 组件库                                          │  │
│  ├──────────────┬──────────────┬──────────────┬──────────────┬──────────────┬──────────────┤  │
│  │ LLM组件      │ RAG组件      │ Tool Calling组件│ Guardian组件 │ 部署组件      │ 交互组件      │  │
│  │ - GPT-4o     │ - 向量数据库  │ - 内部工具    │ - 安全审核   │ - Docker      │ - REST API    │  │
│  │ - Claude 3.5 │ - 文档检索   │ - 外部工具    │ - 业务审核   │ - Kubernetes  │ - GraphQL     │  │
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐