AI Agent不仅仅利用大模型的能力,不仅仅采用与大模型交互的编程范式;还包括利用传统软件工具的能力,包括数字化软件以及与外界进行硬件交互的软件,还包括传统程序的编程范式。大模型应用与传统编程应用的聚合体。

一、核心定义:AI Agent = 大模型应用 + 传统编程应用的聚合体

AI Agent 的核心架构公式可以直观体现这种融合:

Agent = LLM(大脑) + Planning(规划) + Memory(记忆) + Tools(工具)其中,只有 LLM 部分属于 大模型应用范式”,其余模块均依赖传统软件工程技术实现。

1. 大模型应用范式:作为 Agent 的 “决策大脑”

  • 核心作用:理解用户通过自然语言表达的意图拆解复杂目标、决策行动路径、生成自然语言交互
  • 典型技术提示词工程、上下文管理、多轮对话、意图识别
  • 局限性:本身是 “无手无脚” 的文本生成器,无法直接触碰文件、联网或控制硬件,也没有持久化记忆能力

2. 传统编程范式:作为 Agent 的 “执行手脚”

  • 核心作用:提供感知、执行、控制能力,将大模型的决策转化为真实世界的行动
  • 典型技术
    • 数字化软件工具:API 调用、数据库操作、办公软件自动化、浏览器控制
    • 硬件交互能力:通过传感器 / 执行器控制物联网设备、机器人、桌面系统(如模拟键鼠操作)
    • 软件工程范式:状态机管理、错误处理、流程调度、模块化封装、幂等性保证
  • 优势成熟稳定、可监控、可调试,解决大模型无法处理的确定性、重复性任务

二、这种 “聚合体” 如何工作?完整闭环流程

一个标准的 AI Agent 任务处理流程,完整体现了两种范式的协同:

  1. 用户输入:用户提出复杂目标(如 “帮我订一张下周去上海的机票并生成行程单”)
  2. 大模型决策层
    • 理解目标,拆解为子任务:搜索航班→对比价格→提交订单→生成行程单
    • 决定需要调用的工具(航班查询 API、文档生成工具)
  3. 传统工具执行层
    • 调用航班查询 API,获取符合条件的航班信息
    • 将结果返回给大模型,由模型进行筛选决策
    • 调用支付接口完成订单,再调用文档工具生成行程单
  4. 反馈与迭代:工具执行结果再次输入大模型,由模型判断是否完成目标,或调整后续行动

三、技术优势:为什么这种聚合是必然趋势?

1. 突破大模型的能力边界

  • 大模型只能在文本世界中 “思考”,而传统软件工具让它能真正 “行动”
  • 例如:大模型无法直接操作 Excel,但通过调用 Python 脚本或 Office API,就能实现数据统计、报表生成

2. 继承传统软件工程的稳定性

  • 传统工具的异常处理、日志监控、重试机制,能有效弥补大模型幻觉、决策失误的问题
  • 例如:API 调用失败时,可通过传统编程的重试逻辑自动恢复,而不是依赖模型重新决策

3. 大幅降低落地成本

  • 企业无需从零开发所有能力,可直接复用现有数字化系统、API 和硬件交互方案
  • 例如:已有的客户管理系统(CRM)、支付接口、IoT 设备控制程序,都能被 Agent 直接调用

四、与传统聊天机器人的本质区别

表格

对比维度 传统聊天机器人 AI Agent(聚合体)
核心依赖 纯大模型文本生成 大模型决策 + 传统工具执行
交互模式 被动问答,单次响应 主动闭环,感知 - 决策 - 行动 - 反馈
能力边界 文本对话、知识问答 任务规划、工具调用、真实世界操作
编程范式 提示词工程、上下文拼接 大模型决策 + 函数调用 / 脚本执行
典型场景 写文案、聊天、回答问题 自动化办公、订票订酒店、智能家居控制

五、技术落地示例:两种范式的协同实现

以 “帮我整理本周销售数据并生成可视化报表” 为例,完整的 Agent 实现如下:

python

运行

# 1. 大模型决策层:理解目标并拆解任务
def plan_task(user_input):
    # 调用大模型,将用户需求拆解为子任务
    tasks = llm_decompose(user_input)
    return tasks  # 输出:["读取数据库", "统计数据", "生成图表", "导出报表"]

# 2. 传统工具执行层:封装具体操作函数
def read_database(query):
    # 传统数据库操作,从MySQL读取销售数据
    return mysql_query(query)

def generate_chart(data):
    # 传统数据可视化,用Matplotlib生成图表
    return plt.bar(data).savefig()

def export_report(content):
    # 传统文件操作,将结果导出为PDF
    return pdf_export(content)

# 3. 闭环流程:大模型决策+传统工具执行协同
def agent_workflow(user_input):
    tasks = plan_task(user_input)
    results = []
    for task in tasks:
        # 大模型决策调用哪个工具
        if task == "读取数据库":
            data = read_database("SELECT * FROM sales WHERE week=202605")
            results.append(data)
        elif task == "生成图表":
            chart = generate_chart(data)
            results.append(chart)
        # ...其他任务执行
    # 大模型整合结果,生成最终报表
    return llm_summarize(results)

六、未来趋势:从 “增强工具” 到 “自主系统”

随着技术发展,AI Agent 的两种范式融合会更深入:

  • 大模型会越来越擅长理解和使用传统工具,降低工具调用的门槛
  • 传统软件工具会更适配 Agent 的调用需求,提供标准化接口和状态反馈
  • 最终形成 “以用户意图为中心” 的计算范式,用户只需提出目标,Agent 自动完成从决策到执行的全流程

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐