本文首发于同名公众号


写了这么多篇,讲了Agent是什么、怎么工作、能做什么。这一篇,泼点冷水,再聊聊未来。

Agent有哪些问题?未来会怎样?


Agent的五大局限

局限一:可靠性不够。

这是最大的问题。

大模型有幻觉,Agent继承了大模型的幻觉,还可能放大。

什么是幻觉?大模型有时候会自信地说一些不存在的内容。它不是故意骗你,它是真的觉得自己说的是对的。

比如你问Agent:“《反脆弱》这本书的作者是谁?” Agent可能会自信地回答:“作者是纳西姆·尼古拉斯·塔勒布。” 这个回答是对的。但如果问一本比较冷门的书,Agent可能会编一个作者名字出来,而且说得非常自信,不留余地。

一个Agent系统,可能在各个环节出错。检索到错误的信息,理解错了用户意图,调用了错误的工具,输出了有害的内容。任何一个环节出问题,最终的输出就可能出问题。

在低风险场景,比如聊天、写文章,错了也就错了,用户可能都没发现。在高风险场景,比如医疗、法律、金融,一次错误可能代价巨大。你不会想让一个Agent来给你诊断病情、开法律处方、替你做投资决策。

现状是:Agent还没法做到100%可靠,需要人工监督。 至少目前是这样。

局限二:成本不低。

跑一个Agent,比单纯调用大模型贵很多。

原因很简单。Agent处理一个任务,通常需要多次模型调用。中间还要调用外部工具,每次调用都有成本。还要存储和检索向量数据,维护记忆系统。这些加起来,成本是单纯调用的好几倍。

一个复杂任务,Agent可能调用几十次工具。每次工具调用都是钱。检索向量数据库要计算资源。记忆存储要存储空间。

所以,Agent适合高价值任务,不适合低价值任务。你不会用一个Agent来处理"今天吃什么"这种问题,太贵了。但你会用Agent来处理"帮我分析一下这个投资机会"这种问题,回报值得投入。

现状是:Agent的成本结构决定了它只适合中高价值任务。

局限三:速度不够快。

Agent比普通聊天慢。

原因也简单。思考需要时间。工具调用需要等待网络响应和处理时间。多步骤任务需要串行执行,上一步做完才能做下一步。

用户习惯了ChatGPT的秒回,可能等不了Agent的"思考时间"。虽然对于复杂任务来说,等待是值得的,但对于简单任务来说,用户会觉得体验不好。

现在有一种趋势是把Agent做成本地运行,减少网络延迟。但这需要模型能力足够强,在本地就能完成复杂的推理和决策。

现状是:实时性要求高的场景,Agent体验不佳。

局限四:上下文窗口限制。

这是技术瓶颈。

Agent工作需要把大量信息塞进上下文:用户的问题、检索到的资料、工具的返回、历史对话、Agent的思考过程。上下文窗口再大,也是有限的。

现在的模型上下文窗口已经能做到几十万token。但对于复杂任务来说,还是不够用。处理一份几百页的文档、分析一个大型代码库、进行一场涉及几十轮对话的讨论——这些都会触及上下文窗口的边界。

信息太多,Agent就会"失忆"。早期的重要信息被挤出去,Agent可能给出前后不一致的回答。

现在有一些缓解方案,比如分层记忆、外部存储、主动摘要压缩。但本质上,上下文窗口的限制还是存在的。

现状是:需要复杂的记忆系统来弥补上下文窗口的不足。

局限五:工具生态分散。

Agent的价值取决于它能调用多少工具。

但现实是,每个工具都有自己的接口,每个接口都有自己的限制,工具之间缺乏标准。做一个能调用10个工具的Agent不难。做一个能调用100个工具的Agent,很难。

你可能需要为每个工具写适配代码,处理不同的接口格式、认证方式、错误处理。维护成本很高。

另外,有些工具不稳定。API可能限流,可能宕机,可能改接口。Agent需要处理这些异常情况,增加了开发复杂度。

现状是:工具生态还在早期,标准化程度低,整合成本高。


Agent的发展趋势

虽然有局限,但趋势是明确的。

趋势一:越来越自主。

从"人类监督"到"人类在环"。

现在的Agent,需要人类盯着。做什么操作、调用什么工具、输出什么内容,都需要人来确认。

未来的Agent,可以自主完成更多步骤。人类只需要设定目标,Agent自动规划、执行、检查结果。人类只负责最终确认和异常处理。

这个趋势已经在发生了。比如现在的代码助手Copilot,已经能自主生成代码片段,你只需要接受或修改。但这只是局部自主。未来的Agent,会在更大范围实现自主。

趋势二:越来越专业。

从"通用助手"到"垂直专家"。

现在的Agent,通用能力强但专业能力弱。什么都能聊,但聊不深。

未来的Agent,会出现大量垂直领域的专家。医疗Agent、法律Agent、客服Agent、金融Agent、教育Agent。每个领域的Agent都越来越专业,在自己的领域能做到接近甚至超过专业人士的水平。

通用Agent不会消失,但专业Agent会占据大量细分市场。就像现在有通用软件也有专业软件,Agent也会走同样的路。

趋势三:越来越协作。

从"单Agent"到"多Agent系统"。

单个Agent能力有上限。多个Agent协作,能处理更复杂的任务。

就像人类的工作方式。不同人专做不同的事,互相配合,组成一个团队。不同Agent专做不同的事,互相协作,组成一个虚拟团队。

Multi-Agent系统会越来越普遍。不只是同级别的多个Agent协作,还会有层级结构的Agent系统——有负责决策的、有负责执行的、有负责审核的。

趋势四:越来越安全。

从"先跑起来"到"安全第一"。

随着Agent进入高风险场景,安全问题越来越重要。

权限控制:Agent只能做它被授权做的事,不能越界。操作审计:Agent的每一步操作都有记录,能追溯。失败回滚:Agent操作失败后能自动恢复到之前的状态。人工干预:Agent遇到无法处理的情况,能及时通知人并请求干预。

这些安全机制,以前可能觉得是负担。但随着Agent进入医疗、金融、法律等领域,安全不再是可选项,而是必选项。

趋势五:越来越便宜。

从"贵"到"可承受"。

技术进步会降低成本。更高效的模型,同样的效果用更少的算力。更便宜的API,模型提供商会不断降价。更优化的流程,减少不必要的调用和计算。

就像云计算从"贵"变成"便宜",Agent也会。存储和计算的成本一直在下降,这是大趋势。

成本降低后,Agent的应用范围会大幅扩展。现在因为成本太高做不了的事情,到时候都能做了。


Agent的机会在哪里

局限就是创业者的机会。

机会一:垂直领域的Agent。

不做通用助手,专做一个领域。

法律Agent:帮律师做合同审核、案例检索、法律文书撰写。医疗Agent:帮医生做病历分析、药物查询、诊疗建议。金融Agent:帮分析师做财报解读、风控预警、投资研究。

这些领域的共同特点是:专业知识门槛高、数据量巨大、人工处理效率低。Agent进入后,能大幅提升效率,创造巨大价值。

门槛高,护城河也高。一旦在某个领域建立了知识库和行业口碑,后来者很难追赶。

机会二:Agent开发平台。

不做Agent应用,做Agent基础设施。

工具接入平台:帮开发者快速接入各种工具,不用自己写适配代码。测试评估平台:帮开发者评估Agent效果,自动化测试Agent性能。监控运维平台:帮开发者监控Agent运行状态,及时发现问题。

类比一下:不做App,做App Store。Agent应用会越来越多,但开发Agent的基础设施还不够完善。这是基础设施的机会。

机会三:Agent安全合规。

随着Agent进入企业,安全合规需求爆发。

Agent审计:评估Agent的安全性,发现潜在风险。权限管理:控制Agent能做什么不能做什么。数据保护:确保Agent处理的数据安全合规。合规检查:确保Agent的输出符合行业法规。

这个领域现在还是空白,但随着Agent大规模应用,需求会快速起来。

机会四:特定行业的Agent解决方案。

把Agent做成完整解决方案,卖给企业。

不只是提供一个Agent能力,而是提供完整的解决方案。包括Agent本身、知识库、工作流集成、培训和支持。

客服Agent解决方案:帮企业搭建智能客服系统。运维Agent解决方案:帮企业搭建智能运维系统。销售Agent解决方案:帮企业搭建销售助手系统。

这种模式的价值在于,降低企业使用Agent的门槛。企业不需要自己懂技术,买了方案就能用。


普通人的机会

不只是大公司,普通人也能参与Agent浪潮。

学会使用Agent。

这是最基本的。掌握Agent的使用技巧,用Agent提升自己的工作效率。

比如你是个销售,学会用Agent帮你整理客户信息、生成跟进记录、撰写方案文本。你是产品经理,学会用Agent帮你做竞品分析、写需求文档。你是运营,学会用Agent帮你做数据分析、生成运营报告。

用Agent提升效率,是普通人最容易上手的事情。

成为Agent专家。

深入研究某个领域的Agent应用,帮人搭建Agent系统,做Agent培训和咨询。

现在Agent专家还很少,需求已经开始多起来了。很多企业想做Agent应用,但没有懂行的人。这是一个供需错配的机会。

参与Agent生态。

做Agent的内容和教程,建立Agent社区,开发Agent工具和插件。

Agent生态还在早期,有很多空白可以填补。做一个Agent教程账号,可以积累影响力。做一个Agent工具插件,可以积累用户。建立一个Agent社区,可以积累资源。


给创业者的建议

如果你想在这个领域创业。

建议一:从具体问题出发,不要从技术出发。

先找到一个痛点,再想Agent能不能解决。不要先想"我要做个Agent",再去找场景。

找到一个真实的、有人愿意付费的问题,比什么都重要。问题对了,Agent能解决就好。问题不对,Agent再强也没用。

建议二:先在小场景验证,再扩展。

先做一个能跑通的最小可行产品,验证了价值再扩展。

不要一上来就做一个大而全的系统。先找一个切入点,做精做透,证明价值。然后再扩展到更多场景。

Agent应用还在早期,市场还在教育。小步快跑,快速迭代,比一开始就规划大蓝图更务实。

建议三:重视数据和壁垒。

Agent的核心不只是模型,是数据和用户。

没有壁垒的Agent,随时可能被复制。你的知识库别人也能建,你的Prompt别人也能抄。但用户积累下来的使用数据、使用习惯、反馈信息,是别人拿不走的。

从第一天就想清楚,你的壁垒在哪里。是数据,是用户,还是行业认知。找到那个别人拿不走的东西。

建议四:重视合规和安全。

尤其是高风险领域,合规不是可选项,是必选项。

AI监管越来越严格是大趋势。现在不做合规,等监管来了再做,成本会更高。提前布局,把合规和安全作为产品设计的一部分,而不是事后补救。


我的观点

Agent是AI落地的必经之路。

大模型再强,如果不能行动,就只是一个"超级聊天机器人"。能聊天,但改变不了世界。

Agent让AI从"说"走向"做",从"知识"走向"行动"。它能调用工具、执行任务、操作数据、完成工作。这是AI从"能想"到"能做"的关键一步。

它的局限是真实的。可靠性、成本、速度、上下文、工具生态——这些都是真实的问题,不容忽视。

但它代表的方向是确定的。

未来十年,Agent会像移动互联网一样,深刻改变我们的工作和生活。

现在Agent的状态,有点像2007年的智能手机。iPhone刚出来,功能还不完善,应用还很少,很多人觉得"这东西有什么用"。但方向是对的,趋势是确定的。

对于从业者,找到自己能切入的点深耕。Agent涉及的环节很多,总有一个环节是你的机会。

对于使用者,学会和Agent协作。把Agent当成助手而不是替代品,用它的长处,弥补它的短处。

对于观察者,不要低估它的潜力,也不要高估它的现状。保持关注,保持学习,保持开放。

这是一个长期赛道,比的是耐心和积累。


系列总结

从第01篇到第10篇,我们一起梳理了AI Agent的核心知识。

第一篇,我们讲了Agent是什么,和大模型有什么区别。Agent不只是大模型加上工具,它是一个能感知、规划、行动、记忆的完整系统。

第二篇,我们讲了Agent的工作原理。控制中心负责调度,感知模块负责输入,执行模块负责调用工具,记忆模块负责存储信息。

第三篇,我们讲了Agent如何调用工具。Function Calling是核心能力,让Agent能操作外部世界。

第四篇,我们讲了Agent的记忆系统设计。三层记忆体系,让Agent能跨时间积累知识和信息。

第五篇,我们讲了Agent的规划能力。CoT、ReAct、ToT三种框架,让Agent能思考后再行动。

第六篇,我们讲了多Agent如何协作。层级模式、协作模式、竞争模式,各有各的适用场景。

第七篇,我们讲了RAG和Agent的结合。知识库是Agent的延伸,让Agent知道更多、更准确。

第八篇,我们讲了LangChain和LangGraph实战。用框架快速搭Agent,降低开发成本。

第九篇,我们讲了Agent的15个典型应用场景。从客服到编程,从分析到创作。

第十篇,我们讲了Agent的局限与未来。挑战是真实的,机会也是真实的。


给读者的话

这个系列不是终点,而是起点。

AI Agent的发展日新月异。今天写的"局限",可能明年就不存在了。今天说的"前沿",可能很快变成常识。

保持学习,保持好奇。

希望这个系列能帮你搭建起对Agent的基础认知。不是技术细节,而是核心原理和思维方式。知道了这些,再去看新出现的工具和产品,就不会迷失。

有了这些基础,你也能判断:这个Agent解决方案靠不靠谱?这个Agent产品值不值得用?这个Agent创业方向有没有前途?

答案不在别人嘴里,在你自己的判断力里。

这个判断力,是这个系列想要给你的。


详解AI Agent系列 · 完


完整版合集、面试题库、项目实战,全网同名【图解 AI 系列】

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐