企业级Multi-Agent实施案例:从传统RPA降本到自主协同价值创造的全链路实践


二、 摘要/引言(Abstract/Introduction)

2.1 开门见山:传统RPA的天花板和Multi-Agent的曙光

各位软件工程师、架构师、企业数字化负责人,不知道你们有没有经历过或者见过这样的场景:

在某大型零售集团的供应链部门,曾经斥资500万+采购了一套头部RPA厂商的SaaS产品,配置了27个固定流程机器人——从电商平台的订单抓取、ERP的库存同步、到财务发票的OCR校验和ERP凭证生成,上线初期确实效果显著:人力成本从12人/周的纯手工操作降到了2人/周的监控维护,每月直接节省薪资福利约18万元,ROI的计算看起来非常漂亮,甚至还被集团作为“数字化转型标杆案例”在年度大会上展示。

但好景不长,上线后的第7个月,问题开始集中爆发:

  1. 流程“断点率”飙升至23%:因为集团引入了新的社区团购平台、供应商发票格式新增了37种、ERP做了季度性的界面改版——传统RPA机器人完全基于“固定规则+固定界面元素识别”,任何微小的业务或技术变动都需要厂商顾问花3-7天,甚至更长时间重新配置代码(或者低代码/无代码的节点),每次紧急迭代的顾问服务费高达2万-8万不等
  2. 监控维护团队越来越“卷”:虽然只有2名正式员工,但每天要处理50+条机器人告警短信,周末和节假日也经常被叫醒——告警原因要么是某个OCR识别率降到了80%以下(比如扫描件有污渍、打印字体倾斜超过10度),要么是某个网络接口超时了(比如电商平台的API限流阈值临时调整),要么是某个业务人员在ERP里做了“非标准操作”(比如跳过审批步骤直接提交单据);
  3. 价值创造完全“停滞不前”:供应链总监一开始的期望是“机器人不仅能做重复性工作,还能帮我们预测库存预警、优化供应商选择、甚至自动跟供应商谈判账期”——但头部RPA厂商的顾问明确告诉他:“对不起,我们的产品核心是‘降本增效的工具人’,不具备‘思考、预测、决策、谈判’的智能,这些需求需要你们自己去做BI、做算法,然后通过API接口调用”——而当时集团的算法团队只有3个人,还在忙营销部门的用户画像项目,根本抽不出时间。

这个场景不是我编的,而是我去年作为技术顾问深度参与过的一家国内TOP10快消品零售集团的真实经历。当时,他们的供应链部门负责人甚至想过“把那套RPA产品废掉,重新招一批实习生回来干活”——但实习生的离职率太高了,而且数据安全风险也更大。

就在这个时候,Multi-Agent系统(多智能体系统) 进入了我们的视野。经过3个月的调研、2个月的原型开发、1个月的灰度测试、1个月的全量上线,我们为这家零售集团打造了一套**“从订单处理到账期谈判”全链路自主协同的Multi-Agent供应链决策系统**——上线后的第一个季度,不仅流程断点率从23%降到了1.2%,监控维护成本从2人/周降到了0.3人/周(只需要每天早上花10分钟看一下健康报表),更重要的是,它为集团创造了实实在在的“增量价值”

  • 库存周转天数从原来的37天降到了29天,释放了约1.2亿元的流动资金
  • 供应商平均账期从原来的30天延长到了38天,每月为集团节省了约450万元的财务成本(按照年化利率4.5%计算)
  • 滞销品处理率从原来的每月21%提升到了每月57%,每月为集团减少了约280万元的库存损失

那么,什么是Multi-Agent系统?它和传统的RPA、单体AI系统有什么区别?我们是如何为这家零售集团设计、开发、测试、上线这套Multi-Agent系统的?在实施过程中遇到了哪些坑?我们又是如何解决的?今天,我就通过这篇12000字+的深度技术博客,把这些问题全部讲清楚。


三、 正文(Body)

3.1 核心概念:从单体AI、传统RPA到Multi-Agent的认知升级

在正式开始讲我们的实施案例之前,我觉得有必要先给大家梳理一下三个核心概念的定义、核心要素、优缺点、以及它们之间的关系——因为很多人可能对这三个概念的认知还停留在“RPA是流程自动化工具,单体AI是智能工具,Multi-Agent是一堆AI堆在一起”的层面,但实际上,它们之间有着本质的区别。

3.1.1 单体AI系统(Single-Agent AI System)
3.1.1.1 核心概念

单体AI系统是指具有自主感知、自主学习、自主决策能力,但只能独立完成某一个特定、单一任务的人工智能系统——它的核心是“单个智能体+单个任务域”。

3.1.1.2 概念结构与核心要素组成

单体AI系统的概念结构可以用下面的Mermaid概念结构图来表示:

感知数据

结构化/半结构化/非结构化特征

历史数据/规则库/模型库

执行指令

执行结果反馈

执行结果输出

外部环境

感知模块

知识模块

决策模块

执行模块

从上面的概念结构图可以看出,单体AI系统的核心要素包括:

  1. 外部环境:单体AI系统所处的“物理世界”或“数字世界”——比如图像识别系统的外部环境是“摄像头采集的图像”,语音识别系统的外部环境是“麦克风采集的声音”,库存预测系统的外部环境是“历史销售数据、库存数据、天气数据、节假日数据”等;
  2. 感知模块:负责从外部环境中采集、清洗、预处理数据,并提取出有用的特征——比如图像识别系统的感知模块会做“图像去噪、图像增强、特征提取(CNN)”等操作,语音识别系统的感知模块会做“语音降噪、语音分割、特征提取(MFCC)”等操作,库存预测系统的感知模块会做“数据清洗、缺失值填充、异常值检测、特征工程(时间序列特征、天气特征、节假日特征)”等操作;
  3. 知识模块:负责存储、更新、管理单体AI系统所需的所有知识——比如“历史数据(训练集、验证集、测试集)、规则库(硬规则,比如‘当库存低于安全库存的50%时,必须触发补货提醒’)、模型库(软规则,比如‘基于LSTM的时间序列预测模型、基于XGBoost的分类模型’)”等;
  4. 决策模块:负责根据感知模块提取的特征和知识模块存储的知识,做出具体的执行指令——比如图像识别系统的决策模块会输出“图像中物体的类别和位置”,语音识别系统的决策模块会输出“语音对应的文字”,库存预测系统的决策模块会输出“未来7天、14天、30天的库存需求量”;
  5. 执行模块:负责执行决策模块输出的指令,并将执行结果反馈给感知模块(用于后续的自主学习和决策优化),同时将执行结果输出给外部环境——比如库存预测系统的执行模块可能会“将预测结果写入ERP系统的报表模块”,也可能会“直接触发ERP系统的补货申请流程”。
3.1.1.3 优缺点

单体AI系统的优点非常明显:

  • 专注于单一任务:由于它只能完成某一个特定、单一的任务,所以它的模型精度通常非常高——比如目前的图像识别系统(比如OpenAI的GPT-4o、Google的Gemini Pro Vision)在ImageNet数据集上的Top-1准确率已经超过了95%,甚至超过了人类的平均水平;
  • 开发难度相对较低:由于它的核心要素相对简单,而且现在有很多成熟的开源框架(比如TensorFlow、PyTorch、Hugging Face Transformers)和预训练模型(比如BERT、GPT-3/4、LLaMA 2/3、Qwen)可以使用,所以开发一个单体AI系统的难度相对较低,开发周期也相对较短;
  • 部署成本相对较低:由于它的资源消耗相对较小(比如很多预训练模型可以通过量化、剪枝等技术部署在普通的服务器甚至移动设备上),所以部署一个单体AI系统的成本相对较低。

但单体AI系统的缺点也同样非常突出:

  • 任务域单一,无法处理复杂的跨任务、跨领域问题:这是单体AI系统最大的缺点——比如一个库存预测系统只能预测库存需求量,无法处理“电商平台订单抓取→ERP库存同步→财务发票OCR校验→库存需求量预测→供应商选择→自动补货申请→账期谈判”这样的全链路复杂问题;
  • 无法与其他系统(包括其他单体AI系统、传统IT系统、人类员工)进行有效的自主协同:传统的单体AI系统通常是“孤立的”——它只能通过API接口被动地接收其他系统的请求,或者通过API接口被动地向其他系统发送结果,无法主动地与其他系统进行沟通、协商、协作;
  • 自主学习和决策优化的能力有限:传统的单体AI系统通常只能“离线学习”——也就是说,它的模型是在“固定的训练集”上训练出来的,上线后如果没有人工干预(比如重新标注数据、重新训练模型),它的模型精度会随着时间的推移而逐渐下降(因为外部环境是不断变化的)。
3.1.1.4 数学模型

从数学的角度来看,单体AI系统可以被定义为一个**“感知-决策-执行-反馈”的闭环马尔可夫决策过程(MDP, Markov Decision Process)**——因为它的决策只依赖于当前的状态,而不依赖于过去的历史状态(当然,这是在“状态已经包含了所有必要的历史信息”的前提下)。

MDP的数学定义如下:
MDP=⟨S,A,P,R,γ⟩ \text{MDP} = \langle S, A, P, R, \gamma \rangle MDP=S,A,P,R,γ
其中:

  • SSS状态空间(State Space)——所有可能的状态 sss 的集合,比如库存预测系统的状态空间可能是“当前库存水平、过去30天的销售量、未来7天的天气情况、未来7天的节假日情况”等;
  • AAA动作空间(Action Space)——所有可能的动作 aaa 的集合,比如库存预测系统的动作空间可能是“预测未来7天的需求量、预测未来14天的需求量、预测未来30天的需求量”等;
  • PPP状态转移概率函数(State Transition Probability Function)——P(s′∣s,a)P(s'|s,a)P(ss,a) 表示在当前状态 sss 下执行动作 aaa 后,转移到下一个状态 s′s's 的概率,比如库存预测系统的状态转移概率函数可能是“基于历史数据统计出来的,或者基于模型预测出来的”;
  • RRR奖励函数(Reward Function)——R(s,a,s′)R(s,a,s')R(s,a,s) 表示在当前状态 sss 下执行动作 aaa 后,转移到下一个状态 s′s's 时所获得的即时奖励,比如库存预测系统的奖励函数可能是“预测准确率越高,奖励越大;预测误差越大,惩罚越大”;
  • γ\gammaγ折扣因子(Discount Factor)——γ∈[0,1]\gamma \in [0,1]γ[0,1],用来表示“未来奖励的重要性”——如果 γ=0\gamma = 0γ=0,说明智能体只关心“即时奖励”;如果 γ=1\gamma = 1γ=1,说明智能体“同等关心即时奖励和未来所有的奖励”。

单体AI系统的目标就是找到一个最优策略 π∗:S→A\pi^*: S \rightarrow Aπ:SA,使得它的累积折扣奖励(Cumulative Discounted Reward) 最大:
π∗=arg⁡max⁡πEτ∼π[∑t=0∞γtR(st,at,st+1)] \pi^* = \arg\max_{\pi} \mathbb{E}_{\tau \sim \pi} \left[ \sum_{t=0}^{\infty} \gamma^t R(s_t, a_t, s_{t+1}) \right] π=argπmaxEτπ[t=0γtR(st,at,st+1)]
其中 τ=(s0,a0,s1,a1,s2,a2,… )\tau = (s_0, a_0, s_1, a_1, s_2, a_2, \dots)τ=(s0,a0,s1,a1,s2,a2,) 表示智能体的一条轨迹。


3.1.2 传统RPA系统(Robotic Process Automation System)
3.1.2.1 核心概念

传统RPA系统是指能够模拟人类员工的鼠标点击、键盘输入、界面操作等行为,自动完成某一个或某几个固定、标准化、重复性强的流程任务的软件机器人系统——它的核心是“单个或多个软件机器人+固定规则+固定界面元素识别+单个或多个独立流程任务”。

3.1.2.2 概念结构与核心要素组成

传统RPA系统的概念结构可以用下面的Mermaid概念结构图来表示:

界面元素

界面元素

界面元素

流程配置指令

低代码/无代码流程

任务调度指令

模拟鼠标/键盘操作

模拟鼠标/键盘操作

模拟鼠标/键盘操作

执行结果/告警信息

流程修改指令/告警处理指令

传统IT系统1

RPA控制中心

传统IT系统2

传统IT系统3

RPA开发平台

RPA机器人集群

人类监控维护人员

从上面的概念结构图可以看出,传统RPA系统的核心要素包括:

  1. 传统IT系统:RPA机器人的操作对象——比如ERP系统、CRM系统、电商平台后台、银行网银系统、OA系统等;
  2. RPA控制中心:负责RPA系统的“全局管理”——包括流程配置的管理、任务调度的管理、机器人集群的管理、执行结果的监控、告警信息的管理等;
  3. RPA开发平台:负责RPA流程的“开发和配置”——通常采用“低代码/无代码”的方式,通过拖拽节点、设置参数来实现流程的配置,比如“打开浏览器、输入网址、点击登录按钮、输入用户名和密码、点击确认按钮、抓取订单数据、写入Excel文件、打开ERP系统、输入订单数据、点击保存按钮”等;
  4. RPA机器人集群:负责RPA流程的“实际执行”——通常分为“有人值守机器人(Attended RPA)”和“无人值守机器人(Unattended RPA)”两种:有人值守机器人需要在人类员工的电脑上运行,需要人类员工的触发和监控;无人值守机器人则部署在专门的服务器上,可以按照预设的时间或事件自动触发和运行;
  5. 人类监控维护人员:负责RPA系统的“监控、维护、修改”——包括处理机器人的告警信息、修改因业务或技术变动而失效的流程、更新因界面改版而失效的界面元素识别规则等。
3.1.2.3 优缺点

传统RPA系统的优点在前面的零售集团案例中已经提到过了:

  • 上线初期降本增效效果显著:对于那些“固定、标准化、重复性强、人工操作容易出错”的流程任务,传统RPA系统的上线初期降本增效效果非常显著——比如订单抓取、库存同步、发票OCR校验、凭证生成等;
  • 对传统IT系统的侵入性小:传统RPA系统不需要修改传统IT系统的源代码,只需要通过“模拟人类员工的鼠标点击、键盘输入、界面操作”或者“调用传统IT系统的公开API接口”来完成流程任务——这对于那些“源代码已经丢失、或者供应商已经倒闭、或者修改源代码的成本非常高”的传统IT系统来说,是一个非常大的优势;
  • 低代码/无代码开发,业务人员也能参与:很多头部RPA厂商的开发平台都采用了“低代码/无代码”的方式,不需要业务人员具备专业的编程知识,只需要经过简单的培训,就能自己配置一些简单的流程任务——这大大提高了业务人员的参与度,缩短了流程的开发周期。

但传统RPA系统的缺点也在前面的零售集团案例中暴露得淋漓尽致:

  • “脆弱性”极强,流程断点率高:传统RPA系统完全基于“固定规则+固定界面元素识别”——任何微小的业务变动(比如新增了一种供应商发票格式、新增了一个业务审批步骤)或者技术变动(比如ERP做了季度性的界面改版、电商平台的API限流阈值临时调整、扫描件有污渍、打印字体倾斜超过10度)都会导致流程失效,断点率极高;
  • “可扩展性”极差,难以处理复杂的跨任务、跨领域问题:虽然很多头部RPA厂商的产品都支持“多个机器人协同工作”,但这种协同通常是“被动的、串行的、基于固定规则的”——比如“机器人A先做完订单抓取,然后把结果写入Excel文件,然后触发机器人B做库存同步”——无法处理“主动的、并行的、基于协商的、跨任务、跨领域的复杂问题”;
  • “智能性”极低,无法进行自主学习、自主决策、自主协商:传统RPA系统本质上是一个“没有大脑的工具人”——它只能“按照人类预先配置好的固定规则,一步一步地执行”,无法进行自主学习、自主决策、自主协商,更无法为企业创造“增量价值”;
  • “长期维护成本”极高:虽然传统RPA系统的上线初期降本增效效果显著,但随着时间的推移,业务和技术的变动会越来越多,流程的修改、维护、更新成本会越来越高——很多企业的RPA系统上线后的第1-2年,维护成本甚至会超过采购成本。

3.1.3 Multi-Agent系统(Multi-Agent System, MAS)
3.1.3.1 核心概念

终于到了我们今天的主角——Multi-Agent系统(多智能体系统)。关于Multi-Agent系统的定义,学术界有很多种不同的说法,但我觉得最通俗易懂、最适合企业级应用场景的定义是:

Multi-Agent系统是指由两个或两个以上具有自主感知、自主学习、自主决策、自主执行、自主沟通、自主协商、自主协作能力的智能体组成的,能够共同完成某一个或某几个复杂的跨任务、跨领域问题的分布式人工智能系统——它的核心是“多个具有不同角色和能力的智能体+自主协同机制+复杂的跨任务、跨领域问题”。

3.1.3.2 概念结构与核心要素组成

企业级Multi-Agent系统的概念结构可以用下面的Mermaid概念结构图来表示:

智能体集群层

智能体管理层

外部环境层

感知数据

API接口/界面操作

自然语言交互

自然语言交互

结构化需求/指令

任务分配指令

任务分配指令

全局状态信息

全局状态信息

全局状态信息

全局状态信息

全局状态信息

全局状态信息

预处理后的特征/数据

预处理后的特征/数据

更新后的知识

共享的知识

共享的知识

共享的知识

共享的知识

子决策/子任务指令

沟通/协商请求

沟通/协商请求

沟通/协商结果

执行结果/状态更新

执行结果/状态更新

健康数据采集

健康数据采集

健康数据采集

健康数据采集

健康数据采集

健康数据采集

健康数据采集

健康数据采集

健康数据采集

健康数据采集

告警信息

物理世界/数字世界

传统IT系统集群(ERP/CRM/OA/电商平台等)

人类员工集群(业务人员/财务人员/采购人员等)

全局状态管理器

任务分解与分配器

协同机制管理器

知识共享平台

健康监控与告警中心

感知型智能体

知识型智能体

决策型智能体

执行型智能体

沟通型智能体

人类辅助型智能体

其他决策型智能体

从上面的概念结构图可以看出,企业级Multi-Agent系统的核心要素可以分为三层

  1. 外部环境层:包括Multi-Agent系统所处的“物理世界/数字世界”、需要交互的“传统IT系统集群(ERP/CRM/OA/电商平台等)”、以及需要协作的“人类员工集群(业务人员/财务人员/采购人员等)”;
  2. 智能体管理层:负责Multi-Agent系统的“全局管理和协同”——包括全局状态管理器、任务分解与分配器、协同机制管理器、知识共享平台、健康监控与告警中心;
  3. 智能体集群层:负责Multi-Agent系统的“具体任务执行”——通常根据“角色和能力”的不同,分为感知型智能体、知识型智能体、决策型智能体、执行型智能体、沟通型智能体、人类辅助型智能体等。

接下来,我给大家详细讲解一下智能体管理层和智能体集群层的每一个核心要素

3.1.3.2.1 智能体管理层的核心要素
  • 全局状态管理器:负责Multi-Agent系统的“全局状态的采集、存储、更新、分发”——它会从所有的智能体、所有的传统IT系统、所有的人类员工那里采集状态信息,然后将这些状态信息整合在一起,形成一个“全局状态视图”,最后将这个“全局状态视图”分发给所有需要它的智能体;
  • 任务分解与分配器:负责Multi-Agent系统的“复杂任务的分解、子任务的分配、子任务的进度跟踪”——它会根据“人类辅助型智能体传递过来的结构化需求/指令”或者“决策型智能体触发的自主任务”,将一个复杂的跨任务、跨领域问题分解成多个“简单、独立、可执行”的子任务,然后根据“每个智能体的角色、能力、当前负载、历史执行情况”等因素,将这些子任务分配给最合适的智能体,最后跟踪每个子任务的执行进度,确保整个复杂任务能够按时、按质、按量完成;
  • 协同机制管理器:负责Multi-Agent系统的“协同机制的定义、管理、执行”——协同机制是Multi-Agent系统的“灵魂”,没有好的协同机制,多个智能体就会像“一盘散沙”一样,无法有效地共同完成复杂的跨任务、跨领域问题。常见的协同机制包括“合同网协议(Contract Net Protocol, CNP)、拍卖机制、博弈论机制、黑板机制、投票机制”等;
  • 知识共享平台:负责Multi-Agent系统的“知识的采集、存储、更新、共享、检索”——它会从所有的智能体、所有的传统IT系统、所有的人类员工那里采集知识(包括历史数据、规则库、模型库、经验库等),然后将这些知识整合在一起,形成一个“全局知识库”,最后为所有的智能体提供“知识检索、知识更新、知识推理”等服务;
  • 健康监控与告警中心:负责Multi-Agent系统的“健康数据的采集、存储、分析、告警、处理”——它会从所有的智能体、所有的智能体管理层模块那里采集健康数据(包括CPU使用率、内存使用率、磁盘使用率、网络带宽使用率、任务执行成功率、任务执行时间、告警次数等),然后对这些健康数据进行实时分析和离线分析,及时发现系统的异常情况(比如某个智能体的CPU使用率超过了90%、某个任务的执行时间超过了预设的阈值、某个智能体的任务执行成功率降到了80%以下),然后通过“人类辅助型智能体”向人类监控维护人员发送告警信息,并提供“可能的原因分析和解决方案建议”。
3.1.3.2.2 智能体集群层的核心要素
  • 感知型智能体:负责Multi-Agent系统的“感知数据的采集、清洗、预处理、特征提取”——它和单体AI系统的感知模块类似,但它的感知范围更广,感知能力更强——它可以同时从多个外部环境(比如多个摄像头、多个麦克风、多个电商平台、多个ERP系统)采集数据,也可以同时使用多种感知技术(比如OCR、语音识别、图像识别、时间序列分析等);
  • 知识型智能体:负责Multi-Agent系统的“知识的采集、更新、推理、优化”——它和单体AI系统的知识模块类似,但它的知识来源更广,知识推理能力更强——它可以从“知识共享平台”获取全局知识库,也可以从“自身的执行结果反馈”中学习新的知识,还可以使用“知识图谱、大语言模型(LLM)的推理能力”等技术进行知识推理;
  • 决策型智能体:负责Multi-Agent系统的“子任务的决策、子任务的执行指令的生成”——它和单体AI系统的决策模块类似,但它的决策范围更广,决策能力更强——它可以根据“全局状态管理器分发的全局状态视图”、“知识共享平台提供的全局知识库”、“协同机制管理器管理的协同机制”、“沟通型智能体传递过来的其他智能体的沟通/协商结果”等因素,做出更优的决策;
  • 执行型智能体:负责Multi-Agent系统的“子任务的实际执行、执行结果的反馈”——它和传统RPA系统的机器人类似,但它的执行能力更强,执行的灵活性更高——它不仅可以通过“模拟人类员工的鼠标点击、键盘输入、界面操作”来完成流程任务,还可以通过“调用传统IT系统的公开API接口”、“调用其他智能体的服务”来完成流程任务,更可以根据“外部环境的变化”、“决策型智能体的实时调整指令”来灵活调整自己的执行策略;
  • 沟通型智能体:负责Multi-Agent系统的“智能体之间的沟通、协商、协作”——这是Multi-Agent系统和单体AI系统、传统RPA系统最大的区别之一——它可以使用“自然语言处理(NLP)技术”、“大语言模型(LLM)的对话能力”等技术,让智能体之间像“人类员工之间”一样进行自然、流畅、高效的沟通、协商、协作;
  • 人类辅助型智能体:负责Multi-Agent系统的“智能体与人类员工之间的交互、人类员工的需求/指令的理解、结构化需求/指令的生成、执行结果的展示、告警信息的推送”——这也是Multi-Agent系统和单体AI系统、传统RPA系统最大的区别之一——它可以使用“大语言模型(LLM)的对话能力”、“多模态交互技术(比如语音交互、图像交互、文本交互)”等技术,让人类员工和智能体之间像“人与人之间”一样进行自然、流畅、高效的交互。
3.1.3.3 优缺点

企业级Multi-Agent系统的优点非常突出,可以说是“完美解决了单体AI系统和传统RPA系统的所有缺点”:

  • “健壮性”极强,流程断点率极低:企业级Multi-Agent系统不是基于“固定规则+固定界面元素识别”,而是基于“自主感知、自主学习、自主决策、自主协商、自主协作”——如果某个智能体失效了,其他智能体可以“自动接管它的任务”;如果某个外部环境发生了变化,感知型智能体可以“自动适应这种变化”,知识型智能体可以“自动学习新的知识”,决策型智能体可以“自动调整自己的决策策略”,执行型智能体可以“自动调整自己的执行策略”——因此,它的“健壮性”极强,流程断点率极低;
  • “可扩展性”极强,能够处理非常复杂的跨任务、跨领域问题:企业级Multi-Agent系统是一个“分布式人工智能系统”——如果企业需要处理新的任务,只需要“增加一个或几个具有相应角色和能力的智能体”,然后通过“协同机制管理器”将这些新的智能体整合到现有的Multi-Agent系统中即可;如果企业需要处理更复杂的任务,只需要“调整任务分解与分配器的任务分解策略”、“调整协同机制管理器的协同机制”即可——因此,它的“可扩展性”极强,能够处理非常复杂的跨任务、跨领域问题;
  • “智能性”极高,能够进行自主学习、自主决策、自主协商,甚至能够为企业创造“增量价值”:企业级Multi-Agent系统的核心是“多个具有不同角色和能力的智能体+自主协同机制”——它不仅可以“像传统RPA系统一样”完成“固定、标准化、重复性强”的流程任务,还可以“像人类员工的团队一样”进行自主学习、自主决策、自主协商、自主协作,完成“复杂、非标准化、需要创造性”的任务,甚至能够为企业创造“增量价值”——比如预测库存预警、优化供应商选择、自动跟供应商谈判账期、优化物流路线、提高用户满意度等;
  • “长期维护成本”极低:虽然企业级Multi-Agent系统的“前期开发成本”可能比传统RPA系统高,但由于它的“健壮性”极强,“可扩展性”极强,“智能性”极高——它不需要“像传统RPA系统一样”频繁地修改流程、更新界面元素识别规则,也不需要“像传统RPA系统一样”配备大量的人类监控维护人员——因此,它的“长期维护成本”极低,ROI会随着时间的推移而越来越高。

当然,企业级Multi-Agent系统也不是“完美的”,它也有一些缺点

  • “前期开发成本”相对较高:企业级Multi-Agent系统的核心要素比较多,而且需要“整合多种人工智能技术(比如OCR、语音识别、图像识别、时间序列分析、大语言模型、知识图谱、强化学习、博弈论等)”——因此,它的“前期开发成本”相对较高,开发周期也相对较长;
  • “技术门槛”相对较高:企业级Multi-Agent系统的开发需要“具备多种人工智能技术的专业知识”,还需要“具备分布式系统的专业知识”——因此,它的“技术门槛”相对较高,需要企业配备“一支专业的技术团队”或者“找一家专业的技术咨询公司”来协助开发;
  • “可解释性”相对较差:企业级Multi-Agent系统的决策通常是“多个智能体通过自主协同机制共同做出的”——而且如果使用了“大语言模型”、“深度学习模型”等“黑盒模型”,那么决策的“可解释性”会更差——这对于那些“对决策的可解释性要求很高”的行业(比如金融、医疗、法律等)来说,可能是一个比较大的挑战。

3.1.4 概念之间的关系:核心属性维度对比、ER实体关系图、交互关系图

为了让大家更直观地理解单体AI系统、传统RPA系统、Multi-Agent系统之间的关系,我给大家准备了三个东西:

  1. 核心属性维度对比的Markdown表格
  2. ER实体关系图(Mermaid架构图)
  3. 交互关系图(Mermaid架构图)
3.1.4.1 核心属性维度对比的Markdown表格
核心属性维度 单体AI系统 传统RPA系统 企业级Multi-Agent系统
核心定义 单个智能体+单个任务域,具有自主感知、自主学习、自主决策能力,但只能独立完成某一个特定、单一任务的人工智能系统 单个或多个软件机器人+固定规则+固定界面元素识别+单个或多个独立流程任务,能够模拟人类员工的鼠标点击、键盘输入、界面操作等行为,自动完成某一个或某几个固定、标准化、重复性强的流程任务的软件机器人系统 多个具有不同角色和能力的智能体+自主协同机制+复杂的跨任务、跨领域问题,能够共同完成某一个或某几个复杂的跨任务、跨领域问题的分布式人工智能系统
智能体数量 1个 1个或多个(被动、串行、基于固定规则的协同) 2个或多个(主动、并行、基于协商的协同)
任务域 单个特定、单一的任务域 单个或多个独立的、固定的、标准化的、重复性强的流程任务域 多个关联的、复杂的、非标准化的、需要创造性的跨任务、跨领域任务域
智能性 中等(具有自主感知、自主学习、自主决策能力,但无法自主协同) 极低(本质上是“没有大脑的工具人”,只能按照固定规则执行) 极高(具有自主感知、自主学习、自主决策、自主执行、自主沟通、自主协商、自主协作能力,甚至能够为企业创造增量价值)
健壮性 中等(如果外部环境发生了较大的变化,模型精度会下降,甚至失效) 极低(任何微小的业务或技术变动都会导致流程失效,断点率高) 极高(如果某个智能体失效了,其他智能体可以自动接管;如果外部环境发生了变化,智能体可以自动适应、自动学习、自动调整)
可扩展性 低(只能处理单个特定、单一的任务域,无法处理新的任务域) 低(虽然可以增加机器人,但协同是被动、串行、基于固定规则的,难以处理复杂的跨任务、跨领域问题) 极高(需要处理新的任务,只需要增加相应的智能体;需要处理更复杂的任务,只需要调整任务分解策略和协同机制)
前期开发成本 低-中等(有很多成熟的开源框架和预训练模型可以使用) 低-中等(有很多成熟的低代码/无代码开发平台可以使用) 高(需要整合多种人工智能技术和分布式系统技术)
长期维护成本 中等(需要定期重新标注数据、重新训练模型) 高(需要频繁修改流程、更新界面元素识别规则,配备大量的人类监控维护人员) 低(不需要频繁修改流程,不需要配备大量的人类监控维护人员)
对传统IT系统的侵入性 中等(通常需要调用传统IT系统的公开API接口) 极低(不需要修改传统IT系统的源代码,只需要模拟人类员工的操作或调用公开API接口) 低-中等(可以模拟人类员工的操作或调用公开API接口,也可以根据需要对传统IT系统进行少量的改造)
可解释性 中等(如果使用了“白盒模型”,可解释性高;如果使用了“黑盒模型”,可解释性低) 极高(完全基于固定规则,每一步操作都可以解释) 低-中等(如果使用了多个黑盒模型和复杂的协同机制,可解释性差;可以通过“大语言模型的推理链”、“知识图谱”等技术提高可解释性)
适用场景 单个特定、单一的、需要智能的任务域——比如图像识别、语音识别、文本分类、时间序列预测等 单个或多个独立的、固定的、标准化的、重复性强的流程任务域——比如订单抓取、库存同步、发票OCR校验、凭证生成等 多个关联的、复杂的、非标准化的、需要创造性的跨任务、跨领域任务域——比如供应链全链路管理、客户服务全链路管理、金融风控全链路管理、医疗诊断全链路管理等
3.1.4.2 ER实体关系图(Mermaid架构图)

接下来,我给大家画一个单体AI系统、传统RPA系统、Multi-Agent系统之间的ER实体关系图(Mermaid架构图)——这个图主要展示了它们之间的“组成关系”和“依赖关系”:

包含

包含

包含

包含

包含

包含

包含

依赖

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

包含

复用/扩展

复用/扩展

复用/扩展

复用/扩展

复用/扩展

SINGLE_AI_SYSTEM

PERCEPTION_MODULE

KNOWLEDGE_MODULE

DECISION_MODULE

EXECUTION_MODULE

TRADITIONAL_RPA_SYSTEM

RPA_CONTROL_CENTER

RPA_DEVELOPMENT_PLATFORM

RPA_ROBOT_CLUSTER

HUMAN_MONITORING_STAFF

MULTI_AGENT_SYSTEM

EXTERNAL_ENVIRONMENT_LAYER

AGENT_MANAGEMENT_LAYER

AGENT_CLUSTER_LAYER

PHYSICAL_DIGITAL_WORLD

TRADITIONAL_IT_SYSTEM_CLUSTER

HUMAN_EMPLOYEE_CLUSTER

GLOBAL_STATE_MANAGER

TASK_DECOMPOSITION_ALLOCATOR

COORDINATION_MECHANISM_MANAGER

KNOWLEDGE_SHARING_PLATFORM

HEALTH_MONITORING_ALERT_CENTER

PERCEPTION_AGENT

KNOWLEDGE_AGENT

DECISION_AGENT

EXECUTION_AGENT

COMMUNICATION_AGENT

HUMAN_ASSISTANT_AGENT

从上面的ER实体关系图可以看出:

  1. Multi-Agent系统可以复用/扩展单体AI系统的所有模块——比如感知型智能体可以复用/扩展单体AI系统的感知模块,知识型智能体可以复用/扩展单体AI系统的知识模块,决策型智能体可以复用/扩展单体AI系统的决策模块,执行型智能体可以复用/扩展单体AI系统的执行模块;
  2. Multi-Agent系统也可以复用/扩展传统RPA系统的机器人集群——比如执行型智能体可以复用/扩展传统RPA系统的有人值守机器人和无人值守机器人;
  3. 因此,企业在部署Multi-Agent系统的时候,不需要“把之前部署的单体AI系统和传统RPA系统全部废掉”,而是可以“把它们作为Multi-Agent系统的一部分,复用/扩展它们的功能”——这大大降低了企业的前期投入成本。
3.1.4.3 交互关系图(Mermaid架构图)

最后,我给大家画一个单体AI系统、传统RPA系统、Multi-Agent系统与外部环境、人类员工之间的交互关系图(Mermaid架构图)——这个图主要展示了它们之间的“交互方式”和“交互流程”:

Multi-Agent系统 传统RPA系统 单体AI系统 外部环境 Multi-Agent系统 传统RPA系统 单体AI系统 外部环境 单体AI系统的交互流程 人类员工 发送单一任务请求(比如“预测未来30天 1 人类员工
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐