企业部署 AI Agent Harness Engineering 的三种模式:嵌入式、API 式与混合式
企业部署 AI Agent Harness Engineering 的三种模式:嵌入式、API 式与混合式
关键词:AI Agent、Harness Engineering、企业部署模式、嵌入式Agent、API式Agent、混合式Agent、工程化最佳实践
摘要:AI Agent(智能体)正在从实验室走向企业生产环境,成为企业数字化转型的“超级员工”。但如何像管理传统软件一样标准化、可复用、可扩展、高可靠地批量部署 AI Agent,成了当前企业面临的核心痛点——这就是Harness Engineering(智能体工程化)需要解决的问题。本文用“给企业招超级实习生”的生动比喻,结合大量技术细节、Python 代码实战、Mermaid 架构图、数学模型、行业最佳实践,从问题背景、核心概念、问题解决(三种部署模式的全流程解析)、边界与外延、未来趋势等维度,一步一步拆解企业部署 AI Agent Harness Engineering 的完整方案。无论你是 CTO、架构师、AI 算法工程师还是产品经理,读完本文都能找到适合自己企业的部署路径。
背景介绍:企业为什么要做 AI Agent Harness Engineering?
0.1 故事引入:从“天才程序员小明”到“批量标准化的超级实习生团队”
假设你是一家电商公司的 CTO,最近挖到了一个叫“小明”的“全栈天才程序员+资深运营+金牌客服”——他就是你们公司训练的第一个 AI Agent!
- 天才小明刚入职第一天就搞定了三件事:① 自动分析用户画像并生成 10000 条个性化商品推荐文案;② 帮客服团队自动处理了 90% 的常见投诉,响应时间从 1 小时降到 5 秒;③ 凌晨 3 点发现服务器异常,自动触发扩容脚本并修复了问题。
- 你开心坏了,立刻拍板:“给我再招 1000 个这样的小明!”——但当你真的开始“批量招聘小明”时,才发现噩梦来了:
- 小明太多,管理不住:有的小明写文案太激进,违反广告法;有的小明处理投诉太软弱,让用户薅了羊毛;有的小明触发扩容脚本太频繁,每月服务器成本涨了 3 倍;
- 小明的能力参差不齐:第一个小明是“全栈天才”,第二个可能只会写美妆文案,第三个只会处理家电投诉;你没法快速给“特定岗位的小明”分配特定的技能包;
- 小明的“寿命”太短:平台规则变了(比如淘宝新出的广告法),小明写的文案立刻失效;你得重新训练新的小明,成本高、周期长;
- 小明和现有系统“合不来”:小明只能看懂你们新开发的 SaaS 系统,看不懂老的 ERP、CRM、WMS——要让他融入,得重构所有老系统,成本太高;
- 小明会“闯祸”:万一某个黑客入侵了小明的“大脑”(大模型 API 或者知识库),让他给用户发诈骗短信、删除公司数据怎么办?
这时候你才意识到:“招单个天才小明”靠的是“AI 炼金术”(算法调优),但“批量招、管得住、用得好、闯不了大祸的超级实习生团队”,靠的是“AI 工程学”——也就是我们今天要讲的「AI Agent Harness Engineering」。
0.2 问题背景:AI Agent 从“实验室原型”到“企业生产级应用”的三大鸿沟
0.2.1 第一大鸿沟:“原型验证容易” vs “批量生产困难”
目前,全球有超过 1000 款 AI Agent 开发框架(比如 LangChain、AutoGPT、CrewAI、LlamaIndex),任何一个算法工程师都能在 1 天内用 LangChain + GPT-4 搭出一个“原型级 AI Agent”。但根据 Gartner 2024 年的最新报告,全球只有不到 5% 的原型级 AI Agent 能够成功部署到企业生产环境——剩下的 95% 要么在“试用阶段就夭折”,要么在“上线后半年内就下线”。
为什么会这样?因为“原型验证”只需要考虑“能不能用”,但“批量生产”需要考虑:
- 标准化:如何给 AI Agent 定义统一的“入职标准”(能力模型、接口规范、安全规范)?
- 可复用:如何把 AI Agent 的“大脑”(大模型)、“眼睛”(知识库)、“手”(工具链)、“脚”(部署环境)拆成“可插拔的组件”,快速组装出“特定岗位的超级实习生”?
- 可扩展:当用户数量从 1000 涨到 100 万时,如何让 AI Agent 团队的性能不下降?
- 高可靠:当某个大模型 API 挂掉时,如何让 AI Agent 自动切换到备用模型?当某个 AI Agent 犯错误时,如何让“监督岗的 AI Agent”(Guardian Agent)自动发现并纠正?
- 低成本:如何降低 AI Agent 的部署成本、训练成本、运维成本?
0.2.2 第二大鸿沟:“AI 团队自己玩” vs “业务团队一起用”
目前,大多数企业的 AI Agent 都是由“AI 算法团队”主导开发的——业务团队(比如运营、客服、供应链)只能“被动试用”,无法“主动定制”。但根据 McKinsey 2024 年的最新报告,只有当业务团队深度参与 AI Agent 的开发和部署时,AI Agent 才能为企业带来真正的 ROI(投资回报率)。
为什么会这样?因为“AI 团队”懂技术,但不懂业务;“业务团队”懂业务,但不懂技术——双方之间存在“技术-业务鸿沟”。比如:
- 运营团队想让 AI Agent 自动分析抖音上的美妆视频,生成带“热点关键词”的商品推荐文案——但 AI 团队可能不知道“抖音美妆热点关键词的更新频率是每天一次”,也不知道“哪些热点关键词是‘合规的’(不会违反广告法)”;
- 客服团队想让 AI Agent 自动处理“退款申请”——但 AI 团队可能不知道“退款申请的流程是:先核对用户订单,再检查商品是否在退款期内,最后生成退款单并同步到 ERP 系统”,也不知道“哪些退款申请需要人工审核(比如金额超过 1000 元的)”。
0.2.3 第三大鸿沟:“AI Agent 单独工作” vs “AI Agent 与人类、传统系统协同工作”
目前,大多数企业的 AI Agent 都是“单独工作”的——要么“在 SaaS 平台上单独用”,要么“作为传统系统的‘外挂插件’偶尔用”。但根据 IDC 2024 年的最新报告,未来 3 年,企业 80% 的工作将由“AI Agent + 人类 + 传统系统”组成的“混合团队”完成。
为什么会这样?因为“单独工作的 AI Agent”能力有限——比如:
- AI Agent 可以自动处理 90% 的常见投诉,但剩下的 10% 复杂投诉(比如“用户买了电视,用了 1 个月后屏幕坏了,要求赔偿 2 倍金额”),还是需要人类客服处理;
- AI Agent 可以自动生成 10000 条个性化商品推荐文案,但最终哪些文案能上线,还是需要运营主管审核;
- AI Agent 可以自动分析用户订单,但最终生成的退款单还是需要同步到老的 ERP 系统——如果老的 ERP 系统是用 COBOL 写的,没有 API 接口,那 AI Agent 根本没法和它协同。
0.3 问题描述:AI Agent Harness Engineering 到底要解决什么问题?
在讲“AI Agent Harness Engineering 的三种模式”之前,我们首先要明确:什么是 AI Agent?什么是 Harness Engineering?AI Agent Harness Engineering 到底要解决什么问题?
0.3.1 什么是 AI Agent?(像给小学生讲故事一样)
AI Agent 就像企业里的“超级实习生”——他有“大脑”(大模型,比如 GPT-4o、Claude 3.5 Sonnet、Llama 3.1)来思考和决策,有“眼睛”(知识库,比如企业内部的文档库、CRM 库、WMS 库)来获取信息,有“手”(工具链,比如 Python 脚本、API 接口、浏览器插件)来执行任务,有“脚”(部署环境,比如 Docker 容器、Kubernetes 集群、云服务器)来移动和工作,还有“耳朵”和“嘴巴”(对话界面,比如 Slack、微信、钉钉、企业自研的 SaaS 平台)来和人类、其他 AI Agent 交流。
0.3.2 什么是 Harness Engineering?(像给小学生讲故事一样)
Harness Engineering 就像企业里的“超级实习生管理系统”+“超级实习生培训学院”+“超级实习生考核体系”+“超级实习生安全保障体系”——它的核心目标是:
- 批量标准化招聘超级实习生:不用每次都“从头培养”,而是从“可插拔的组件库”里快速组装出“特定岗位的超级实习生”;
- 让业务团队一起参与培训和管理:不用懂技术,业务团队就能通过“可视化拖拽界面”给超级实习生分配任务、设置规则、添加工具;
- 让超级实习生、人类、传统系统协同工作:给超级实习生安排“人类导师”和“传统系统对接员”,让混合团队高效协作;
- 让超级实习生闯不了大祸:给超级实习生设置“防火墙”(安全规范)、“监督岗”(Guardian Agent)、“紧急刹车”(应急响应机制);
- 持续提升超级实习生的能力:通过“反馈闭环”,让人类导师、用户、其他系统的反馈持续优化超级实习生的“大脑”和“技能包”。
0.3.3 AI Agent Harness Engineering 的核心问题列表(结构化思考)
根据前面的故事和背景,我们可以把 AI Agent Harness Engineering 的核心问题总结为“5W2H”模型:
- Who(谁用?):AI 算法工程师、业务团队(运营、客服、供应链等)、IT 运维人员、CTO/架构师;
- What(做什么?):组件化开发 AI Agent、批量部署 AI Agent、标准化管理 AI Agent、安全保障 AI Agent、反馈优化 AI Agent;
- When(什么时候用?):当企业需要“批量标准化部署 AI Agent”时;当企业需要“业务团队深度参与 AI Agent 开发”时;当企业需要“AI Agent 与人类、传统系统协同工作”时;
- Where(在哪里用?):可以部署在公有云(比如 AWS、Azure、阿里云)、私有云(比如企业自建的 OpenStack、VMware)、混合云(既有公有云又有私有云),也可以部署在边缘设备(比如工厂里的机器人、仓库里的 PDA);
- Why(为什么用?):为了跨越“原型验证-批量生产”、“AI 团队-业务团队”、“单独工作-协同工作”三大鸿沟,为企业带来真正的 ROI;
- How(怎么用?):这就是我们今天要讲的重点——嵌入式、API 式、混合式三种部署模式;
- How much(成本多少?):我们会在后面的“边界与外延”章节详细对比三种部署模式的成本。
0.4 预期读者
本文适合以下人群阅读:
- CTO/架构师:想了解 AI Agent Harness Engineering 的整体架构和技术选型;
- AI 算法工程师:想学习 AI Agent 组件化开发、批量部署、反馈优化的具体技术细节;
- 业务团队负责人:想了解如何深度参与 AI Agent 的开发和部署,如何让 AI Agent 为自己的业务带来 ROI;
- IT 运维人员:想了解如何标准化管理、安全保障、监控运维 AI Agent;
- AI 产品经理:想了解如何设计 AI Agent Harness Engineering 平台的产品功能。
0.5 文档结构概述(像玩游戏的“关卡地图”一样)
本文的结构就像“玩一个超级实习生管理系统的通关游戏”:
- 第一关:新手村(背景介绍):了解为什么要做 AI Agent Harness Engineering,它要解决什么问题;
- 第二关:技能学习(核心概念与联系):学习 AI Agent、Harness Engineering、三种部署模式的核心概念,以及它们之间的关系;
- 第三关:基础模式(嵌入式部署模式):学习如何把 AI Agent 嵌入到企业现有的系统里,适合“只想给现有系统加个 AI 功能”的企业;
- 第四关:进阶模式(API 式部署模式):学习如何把 AI Agent 部署成独立的 API 服务,适合“想让多个系统共用同一个 AI Agent 团队”的企业;
- 第五关:高级模式(混合式部署模式):学习如何结合嵌入式和 API 式的优点,适合“业务场景复杂、既有老系统又有新系统”的企业;
- 第六关:装备升级(工具和资源推荐):了解 AI Agent Harness Engineering 领域的主流工具和资源;
- 第七关:未来展望(未来发展趋势与挑战):了解 AI Agent Harness Engineering 领域的未来发展趋势和挑战;
- 第八关:通关总结(总结):回顾本文的核心内容;
- 第九关:挑战关卡(思考题):鼓励读者进一步思考和应用所学知识;
- 第十关:隐藏关卡(附录):解答常见问题,推荐扩展阅读和参考资料。
0.6 术语表
0.6.1 核心术语定义
| 核心术语 | 通俗易懂的定义(给小学生) | 专业定义(给技术人员) |
|---|---|---|
| AI Agent | 企业里的“超级实习生”,有大脑、眼睛、手、脚、耳朵和嘴巴 | 一种能够感知环境、自主决策、执行任务、并与其他智能体/人类交互的智能系统,通常由大模型(LLM)、知识库(RAG)、工具链(Tool Calling)、部署环境、交互界面五部分组成 |
| Harness Engineering | 企业里的“超级实习生管理系统+培训学院+考核体系+安全保障体系” | 一种用于标准化、可复用、可扩展、高可靠、低成本地批量开发、部署、管理、监控、优化 AI Agent 的工程化方法和技术体系 |
| 嵌入式部署模式 | 把“超级实习生”直接安排在“老办公室”(现有系统)里,让他和老员工(现有系统的功能)一起工作 | 把 AI Agent 的核心逻辑(LLM、RAG、Tool Calling)直接嵌入到企业现有的软件系统(比如 ERP、CRM、WMS、SaaS 平台)的代码库中,作为现有系统的一个“内部模块”运行 |
| API 式部署模式 | 把“超级实习生团队”安排在“独立办公楼”(独立的服务集群)里,让“老办公室”(现有系统)、“新办公室”(新开发的系统)、“人类员工”(通过对话界面)都可以通过“电话/传真”(API 接口)找他们帮忙 | 把 AI Agent 的核心逻辑部署成独立的、可扩展的 API 服务集群,企业现有的系统、新开发的系统、人类用户都可以通过标准化的 API 接口调用这些服务 |
| 混合式部署模式 | 把一部分“超级实习生”安排在“老办公室”(现有系统)里,把另一部分“超级实习生团队”安排在“独立办公楼”(独立的服务集群)里,让两者协同工作 | 结合嵌入式和 API 式的优点,把一部分 AI Agent 嵌入到企业现有系统中(处理对响应速度要求极高、数据安全性要求极高的任务),把另一部分 AI Agent 部署成独立的 API 服务集群(处理对复用性要求极高、扩展性要求极高的任务) |
0.6.2 相关概念解释
| 相关概念 | 通俗易懂的定义(给小学生) | 专业定义(给技术人员) |
|---|---|---|
| LLM(大语言模型) | 超级实习生的“大脑”,会思考、会说话、会写东西 | 一种基于 Transformer 架构的预训练语言模型,具有强大的自然语言理解、生成、推理能力,比如 GPT-4o、Claude 3.5 Sonnet、Llama 3.1 |
| RAG(检索增强生成) | 超级实习生的“眼睛+图书馆”,让他可以从图书馆(企业内部知识库)里找资料,回答问题时不会“胡编乱造” | 一种将信息检索(IR)和文本生成(NLG)结合起来的技术,首先从知识库中检索出与用户问题相关的文档片段,然后将这些片段和用户问题一起输入到 LLM 中,生成更准确、更可靠的答案 |
| Tool Calling(工具调用) | 超级实习生的“手+工具箱”,让他可以使用各种工具(比如 Python 脚本、API 接口、浏览器插件)来执行任务 | 一种让 LLM 能够自动调用外部工具(比如搜索引擎、计算器、数据库、API 接口)的技术,扩展了 LLM 的能力边界,让它可以处理更复杂的任务 |
| Guardian Agent(监督岗智能体) | 超级实习生的“主管”,负责监督超级实习生的工作,发现错误及时纠正 | 一种专门用于监控、审核、纠正其他 AI Agent 的智能体,通常负责检查 AI Agent 的输出是否符合安全规范、伦理规范、业务规范 |
| Feedback Loop(反馈闭环) | 超级实习生的“培训机制”,让他可以从人类导师、用户、其他系统的反馈中持续学习,提升能力 | 一种将 AI Agent 的输出、人类/系统的反馈、模型的优化训练结合起来的循环机制,是提升 AI Agent 性能的核心 |
0.6.3 缩略词列表
| 缩略词 | 全称 | 中文翻译 |
|---|---|---|
| AI | Artificial Intelligence | 人工智能 |
| LLM | Large Language Model | 大语言模型 |
| RAG | Retrieval-Augmented Generation | 检索增强生成 |
| API | Application Programming Interface | 应用程序编程接口 |
| SaaS | Software as a Service | 软件即服务 |
| ERP | Enterprise Resource Planning | 企业资源计划 |
| CRM | Customer Relationship Management | 客户关系管理 |
| WMS | Warehouse Management System | 仓库管理系统 |
| Docker | - | 一种开源的容器化平台 |
| Kubernetes | - | 一种开源的容器编排平台,简称 K8s |
| ROI | Return on Investment | 投资回报率 |
| Gartner | - | 全球最权威的 IT 研究与咨询公司之一 |
| McKinsey | - | 全球最权威的管理咨询公司之一 |
| IDC | International Data Corporation | 国际数据公司 |
核心概念与联系:三种部署模式的本质是什么?它们之间有什么区别?
1.1 故事引入:从“给老办公室装空调”到“建独立的中央空调系统”
让我们继续用“超级实习生”的比喻,来理解三种部署模式的本质:
假设你是一家公司的行政主管,公司有两种办公室:
- 老办公室:已经有 10 年历史了,房间格局固定,没有预留空调外机的位置,只能装“窗式空调”;
- 新办公室:刚建好不久,房间格局灵活,预留了中央空调的管道,可以装“中央空调”;
现在,公司要解决“夏天太热、冬天太冷”的问题——这就像企业要解决“现有系统没有 AI 功能、新系统需要 AI 功能、多个系统需要共用 AI 功能”的问题。
你有三种解决方案:
- 方案一:给每个老办公室单独装窗式空调——这就是我们今天要讲的嵌入式部署模式;
- 优点:安装速度快,不需要改老办公室的格局,成本低(只需要买窗式空调的钱);
- 缺点:每个窗式空调只能给一个老办公室用,无法复用;窗式空调的制冷/制热效果有限,无法满足大房间的需求;需要单独管理每个窗式空调(比如开关、温度调节、维修),管理成本高;
- 方案二:建一个独立的中央空调系统,给所有老办公室和新办公室都装中央空调的出风口——这就是我们今天要讲的API 式部署模式;
- 优点:中央空调可以给所有办公室用,复用性高;中央空调的制冷/制热效果好,扩展性强(再建 10 个新办公室也没问题);只需要管理一个中央空调系统,管理成本低;
- 缺点:安装速度慢,需要给老办公室改格局(装中央空调的管道),成本高(需要买中央空调主机、管道、出风口的钱);如果中央空调主机坏了,所有办公室都没有空调用,可靠性低;
- 方案三:给一部分对温度要求极高、房间格局无法改的老办公室单独装窗式空调,给其他老办公室和所有新办公室装中央空调的出风口——这就是我们今天要讲的混合式部署模式;
- 优点:结合了方案一和方案二的优点,既满足了“对温度要求极高、房间格局无法改的老办公室”的需求,又满足了“复用性、扩展性、管理成本低”的需求;
- 缺点:需要同时管理窗式空调和中央空调,管理复杂度比方案一和方案二高;
通过这个比喻,你是不是已经对三种部署模式的本质有了一个初步的了解?接下来,我们会用更专业的语言,详细讲解三种部署模式的核心概念、区别、联系。
1.2 核心概念解释(专业定义+小学生比喻)
1.2.1 核心概念一:嵌入式部署模式
- 专业定义:把 AI Agent 的核心逻辑(LLM、RAG、Tool Calling、Guardian Agent 等)直接嵌入到企业现有的软件系统(比如 ERP、CRM、WMS、SaaS 平台)的代码库中,作为现有系统的一个“内部模块”运行——AI Agent 和现有系统共享同一个进程、同一个内存空间、同一个数据库连接、同一个部署环境。
- 小学生比喻:给每个老办公室单独装窗式空调——窗式空调和老办公室的墙壁是“连在一起”的,共用同一个电源插座、同一个窗户(作为外机的通风口),不需要额外的管道。
1.2.2 核心概念二:API 式部署模式
- 专业定义:把 AI Agent 的核心逻辑部署成独立的、可扩展的 API 服务集群(通常用 Docker 容器化、Kubernetes 编排),企业现有的系统、新开发的系统、人类用户都可以通过标准化的 API 接口(比如 REST API、GraphQL API、gRPC API)调用这些服务——AI Agent 和现有系统是“分离的”,它们通过网络进行通信,不共享进程、内存空间、数据库连接、部署环境。
- 小学生比喻:建一个独立的中央空调系统——中央空调主机放在“独立机房”里,通过管道连接到所有老办公室和新办公室的出风口,所有办公室都可以通过“遥控器”(API 接口)调节温度,不需要共用同一个电源插座、同一个窗户。
1.2.3 核心概念三:混合式部署模式
- 专业定义:结合嵌入式和 API 式的优点,根据业务场景的不同,把 AI Agent 分成两类:
- 本地 Agent:嵌入到企业现有系统中,处理**对响应速度要求极高(毫秒级)、数据安全性要求极高(数据不能离开企业内网)、业务逻辑非常固定(不需要频繁更新)**的任务;
- 云端/集群 Agent:部署成独立的 API 服务集群,处理**对复用性要求极高(多个系统共用)、扩展性要求极高(用户数量波动大)、业务逻辑需要频繁更新(比如根据热点更新推荐文案)、需要调用外部大模型/外部工具(比如 OpenAI GPT-4o、Google Search API)**的任务;
- 小学生比喻:给一部分对温度要求极高、房间格局无法改的老办公室单独装窗式空调,给其他老办公室和所有新办公室装中央空调的出风口——既满足了特殊需求,又兼顾了整体效率。
1.3 核心概念之间的关系(属性对比+ER 架构图+交互关系图)
1.3.1 概念核心属性维度对比(markdown 表格)
为了更清晰地对比三种部署模式的区别,我们从部署复杂度、响应速度、数据安全性、复用性、扩展性、管理成本、适用场景7 个核心属性维度进行对比:
| 核心属性维度 | 嵌入式部署模式 | API 式部署模式 | 混合式部署模式 |
|---|---|---|---|
| 部署复杂度 | 低(只需要修改现有系统的代码库,不需要额外的容器化/编排工作) | 高(需要设计 API 接口、容器化 Agent、搭建 K8s 集群、配置负载均衡/监控/告警) | 中高(需要同时处理嵌入式和 API 式的部署工作,管理复杂度比前两者高) |
| 响应速度 | 极快(共享内存空间/数据库连接,不需要网络通信,延迟通常在毫秒级) | 较慢(需要通过网络进行 API 调用,延迟通常在几十毫秒到几秒之间,取决于网络状况和服务集群的性能) | 快(本地 Agent 处理极快,云端 Agent 处理较慢,根据业务场景分配任务,整体响应速度满足需求) |
| 数据安全性 | 极高(数据不需要离开企业内网/现有系统的数据库,不需要通过网络传输) | 中高(如果把 Agent 部署在私有云/企业内网,数据安全性较高;如果部署在公有云,需要使用加密传输(HTTPS/TLS)、加密存储(AES-256)等技术保障数据安全) | 极高(本地 Agent 处理敏感数据,不需要离开企业内网;云端 Agent 处理非敏感数据,或者通过加密技术保障数据安全) |
| 复用性 | 极低(每个 Agent 只能嵌入到一个现有系统中,无法复用;如果要给另一个系统加同样的 AI 功能,需要重新开发/复制代码) | 极高(所有系统、人类用户都可以通过标准化的 API 接口调用同一个 Agent 服务集群,复用性非常高) | 高(本地 Agent 复用性低,但可以把本地 Agent 的核心逻辑抽象成可复用的组件;云端 Agent 复用性高,所有系统都可以调用) |
| 扩展性 | 极低(和现有系统共享同一个部署环境,现有系统的扩展性决定了 Agent 的扩展性;如果现有系统无法扩展,Agent 也无法扩展) | 极高(用 K8s 编排容器化的 Agent,可以根据用户数量/任务量自动扩缩容;再增加 100 个系统/100 万用户也没问题) | 高(本地 Agent 扩展性低,但可以根据业务场景增加本地 Agent 的数量;云端 Agent 扩展性极高,可以自动扩缩容) |
| 管理成本 | 高(每个 Agent 都嵌入在不同的现有系统中,需要单独管理、单独更新、单独监控;如果有 100 个系统,就需要管理 100 个 Agent) | 低(只需要管理一个 Agent 服务集群,统一更新、统一监控、统一告警;管理成本非常低) | 中(需要同时管理本地 Agent 和云端 Agent,管理复杂度比前两者高,但可以通过统一的 Harness Engineering 平台降低管理成本) |
| 适用场景 | 1. 只想给单个现有系统加个 AI 功能; 2. 业务场景对响应速度要求极高(比如工厂里的机器人控制、金融交易系统的风险识别); 3. 业务场景对数据安全性要求极高(比如医院的病历管理系统、银行的客户信息管理系统); 4. 现有系统是老系统,没有预留 API 接口,无法改造成调用云端 Agent 的模式; |
1. 想让多个系统/人类用户共用同一个 AI Agent 团队; 2. 业务场景对复用性要求极高(比如个性化商品推荐、客服机器人、内容生成); 3. 业务场景对扩展性要求极高(比如双 11 期间的客服机器人、用户数量波动大的 SaaS 平台); 4. 业务逻辑需要频繁更新(比如根据热点更新推荐文案、根据平台规则更新投诉处理流程); 5. 需要调用外部大模型/外部工具(比如 OpenAI GPT-4o、Google Search API、Weather API); |
1. 业务场景复杂,既有对响应速度/数据安全性要求极高的任务,又有对复用性/扩展性要求极高的任务; 2. 企业既有老系统(没有预留 API 接口),又有新系统(预留了 API 接口); 3. 企业想逐步迁移到 API 式部署模式,先给一部分系统加嵌入式 Agent,再逐步把其他系统迁移到云端 Agent; |
1.3.2 概念联系的 ER 实体关系架构图(Mermaid)
为了更清晰地展示三种部署模式、Harness Engineering 平台、AI Agent 组件、企业系统、人类用户之间的实体关系,我们画了一个 Mermaid ER 架构图:
1.3.3 三种部署模式的交互关系图(Mermaid)
为了更清晰地展示三种部署模式下,AI Agent、企业系统、人类用户、Harness Engineering 平台之间的交互流程,我们分别画了三个 Mermaid 交互关系图:
1.3.3.1 嵌入式部署模式的交互关系图
1.3.3.2 API 式部署模式的交互关系图
1.3.3.3 混合式部署模式的交互关系图
1.4 核心概念原理和架构的文本示意图(专业定义)
为了更清晰地展示 AI Agent Harness Engineering 的整体架构和三种部署模式的原理,我们画了一个文本示意图:
┌───────────────────────────────────────────────────────────────────────────────────────────────┐
│ AI Agent Harness Engineering 平台 │
├───────────────────────────────────────────────────────────────────────────────────────────────┤
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│ │ 组件化开发平台 │ │ 批量部署平台 │ │ 标准化管理平台 │ │ 安全保障平台 │ │ 反馈优化平台 │ │
│ │ - 可视化拖拽 │ │ - 嵌入式部署 │ │ - 统一监控 │ │ - 数据加密 │ │ - 反馈收集 │ │
│ │ - 组件库管理 │ │ - API式部署 │ │ - 统一告警 │ │ - 权限控制 │ │ - 反馈分析 │ │
│ │ - 代码生成 │ │ - 混合式部署 │ │ - 统一更新 │ │ - 内容审核 │ │ - 模型微调 │ │
│ │ - 测试验证 │ │ - 容器化编排 │ │ - 统一计费 │ │ - 应急响应 │ │ - 组件更新 │ │
│ └──────────────┘ └──────────────┘ └──────────────┘ └──────────────┘ └──────────────┘ │
├───────────────────────────────────────────────────────────────────────────────────────────────┤
│ ┌───────────────────────────────────────────────────────────────────────────────────────────┐ │
│ │ AI Agent 组件库 │ │
│ ├──────────────┬──────────────┬──────────────┬──────────────┬──────────────┬──────────────┤ │
│ │ LLM组件 │ RAG组件 │ Tool Calling组件│ Guardian组件 │ 部署组件 │ 交互组件 │ │
│ │ - GPT-4o │ - 向量数据库 │ - 内部工具 │ - 安全审核 │ - Docker │ - REST API │ │
│ │ - Claude 3.5 │ - 文档检索 │ - 外部工具 │ - 业务审核 │ - Kubernetes │ - GraphQL │ │
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)