00：初识Agent

STC89C52RCQAQ

729人浏览 · 2026-05-07 00:38:37

STC89C52RCQAQ · 2026-05-07 00:38:37 发布

Agent意为代理, 我认为实质上就是对LLM的自主代理
我理解中的Agent就是一个能够自主规划的AI系统，它所具备区别于LLM的区别在于Agent的机制：自主规划 -> 动态执行 -> 感知结果并作出调整。

1. 对Agent 的第一层理解：它不是“会调用工具”这么简单

刚接触Agent的时候，会下意识把它理解成：

能联网搜索的大模型
能调用 API 的大模型
能写代码的大模型

这些说法都对，但都不完整。

因为如果只是“调一个工具，然后返回结果”，那它更像是一次工具调用，不是真正的 Agent。
真正的 Agent 关键在于它有一个闭环：

目标 → 拆解 → 执行 → 观察结果 → 调整下一步

我的理解是： 它不是一次性回答，而是持续完成任务。

2. 为什么 LLM 不等于 Agent

从能力上看，LLM 很强，但它有几个天然短板：

2.1 它不会主动做事

你问它，它答你；你不问，它不会自己推进任务。

2.2 它缺少持续状态

一次调用结束后，很多信息就“断掉”了。
如果没有额外的记忆设计，它很难记住：

任务做到哪一步了
用户偏好是什么
上一次失败的原因是什么

2.3 它不会真正行动

LLM 本身输出的是文本。
而 Agent 要做的是把“文本建议”变成“真实动作”：

查询数据库
调接口
执行代码
发送邮件
访问网页
触发工作流

所以，LLM 是核心大脑，Agent 是带执行链路的大脑系统。

LLM的局限性

3. 怎么描述 Agent 的本质

我理解中的Agent就像下面的这句话：

Agent 是一个能在约束条件下，自主完成多步任务的 AI 系统。

这里面有几个词很关键：

自主：不是每一步都要人手把手喂指令。
多步任务：不是一次问答就结束。
约束条件：Agent 不是完全自由，它要在权限、工具、规则里行动。
完成任务：不是“说得像”，而是“真的做完”。

这也是为什么现在很多 Agent 设计，都会强调：

规划
工具调用
记忆
反思
协作
监控与评估

4. Agent 的核心闭环：感知 → 规划 → 行动 → 再感知

在这里插入图片描述

4.1 感知

Agent 先接收外部输入，比如：

用户需求
工具返回结果
环境变化
任务进度

4.2 规划

Agent 会把目标拆成小步骤。
比如“帮我整理竞品分析报告”，它可能会想：

先搜资料
再提炼关键维度
再对比优劣
最后组织成报告

4.3 行动

规划之后，它会调用工具执行：

搜索引擎
数据库
代码执行器
邮件接口
业务 API

4.4 再感知

执行完不是结束，而是继续观察：

成功了吗
结果对不对
要不要重试
计划要不要改

这一步很重要。
没有“再感知”和“纠错”，很多系统只是自动化脚本，不算真正的 Agent。

5. Agent 的基本架构

Agent 架构，通常分为以下 4 个核心块：

5.1 大模型：负责理解与决策

它负责理解任务、做推理、决定下一步做什么。

5.2 工具层：负责把想法变成动作

工具可以是：

搜索
检索
数据库
代码执行
外部 API
浏览器
日历、邮件、IM 系统

5.3 记忆层：负责保持上下文

通常可以分成两类：

短期记忆：当前任务执行过程中的状态
长期记忆：跨任务的偏好、历史信息、知识沉淀

5.4 控制层：负责调度与约束

这一层决定：

什么时候调用哪个工具
什么时候停止
什么时候让人确认
什么时候回滚
什么时候换策略

6. Workflow、Agent、Tools区别与联系

感觉这个地方容易搞混，或者说没法很好的说清楚。

6.1 Tools

Tools 是能力本身。
比如搜索、发邮件、查天气、执行 SQL。

6.2 Workflow

Workflow 是流程编排。
它更像“先做 A，再做 B，再做 C”的固定流程。

6.3 Agent

Agent 则更偏向“自己决定下一步怎么做”。
它不是死板地按流程走，而是根据中间结果动态调整。

Tools 是手段，Workflow 是流程，Agent 是会选择流程和手段的执行者。

7. 常见 Agent 设计范式

7.1 ReAct

ReAct 的核心是 Reasoning + Acting。
先思考，再行动，再根据结果继续思考。

它适合那种：

需要边查边改
信息不确定
任务路径不稳定

7.2 Plan-and-Execute

先规划，再逐步执行。
适合长任务、复杂任务、任务拆解很明显的场景。

7.3 Reflection

执行完后，回头检查自己哪里做得不够好。
它的价值在于：

降低低级错误
提高答案稳定性
让系统有“自我修正”的能力

7.4 Multi-Agent

多个 Agent 分工合作。
比如一个负责检索，一个负责总结，一个负责审校。

我的感觉是：
单 Agent 更轻、更简单；
Multi-Agent 更像团队，但复杂度也更高。

9. 吴恩达关于 Agent 的一个观点

吴恩达在谈到 **agentic workflows** 时说过，不要看一个系统是不是Agent，而是看有多agentic。

参考资料

小林笔记
OpenAI 官方文档：Agents / Agents SDK
Andrew Ng 关于 agentic workflows 的相关公开发言

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

格式规范否？8款AI写作辅助软件排行榜，毕业答辩稳了！

AtomGit开源社区

智能体Prompt工程核心技巧：让 AI Agent Harness Engineering 精准理解复杂指令

在正式展开「智能体Prompt工程核心技巧」之前，我们必须先厘清几个最容易混淆的核心概念——这也是很多人在做Prompt工程时踩的第一个大坑：概念不清，导致方法错配。

AtomGit开源社区

AI时代为什么会出现OPC一人公司？

AtomGit开源社区

所有评论(0)

查看更多评论

STC89C52RCQAQ

@STC89C52RCQAQ

已为社区贡献7条内容

00：初识Agent

STC89C52RCQAQ

1. 对Agent 的第一层理解：它不是“会调用工具”这么简单

2. 为什么 LLM 不等于 Agent

2.1 它不会主动做事

2.2 它缺少持续状态

2.3 它不会真正行动

3. 怎么描述 Agent 的本质

4. Agent 的核心闭环：感知 → 规划 → 行动 → 再感知

4.1 感知

4.2 规划

4.3 行动

4.4 再感知

5. Agent 的基本架构

5.1 大模型：负责理解与决策

5.2 工具层：负责把想法变成动作

5.3 记忆层：负责保持上下文

5.4 控制层：负责调度与约束

6. Workflow、Agent、Tools区别与联系

6.1 Tools

6.2 Workflow

6.3 Agent

7. 常见 Agent 设计范式

7.1 ReAct

7.2 Plan-and-Execute

7.3 Reflection

7.4 Multi-Agent

9. 吴恩达关于 Agent 的一个观点

参考资料

所有评论(0)

温馨提示：您尚未绑定手机号

STC89C52RCQAQ