00:初识Agent
Agent意为代理, 我认为实质上就是对LLM的自主代理
我理解中的Agent就是一个能够自主规划的AI系统,它所具备区别于LLM的区别在于Agent的机制:自主规划 -> 动态执行 -> 感知结果并作出调整。
1. 对Agent 的第一层理解:它不是“会调用工具”这么简单
刚接触Agent的时候,会下意识把它理解成:
- 能联网搜索的大模型
- 能调用 API 的大模型
- 能写代码的大模型
这些说法都对,但都不完整。
因为如果只是“调一个工具,然后返回结果”,那它更像是一次工具调用,不是真正的 Agent。
真正的 Agent 关键在于它有一个闭环:
目标 → 拆解 → 执行 → 观察结果 → 调整下一步
我的理解是: 它不是一次性回答,而是持续完成任务。
2. 为什么 LLM 不等于 Agent
从能力上看,LLM 很强,但它有几个天然短板:
2.1 它不会主动做事
你问它,它答你;你不问,它不会自己推进任务。
2.2 它缺少持续状态
一次调用结束后,很多信息就“断掉”了。
如果没有额外的记忆设计,它很难记住:
- 任务做到哪一步了
- 用户偏好是什么
- 上一次失败的原因是什么
2.3 它不会真正行动
LLM 本身输出的是文本。
而 Agent 要做的是把“文本建议”变成“真实动作”:
- 查询数据库
- 调接口
- 执行代码
- 发送邮件
- 访问网页
- 触发工作流
所以,LLM 是核心大脑,Agent 是带执行链路的大脑系统。

3. 怎么描述 Agent 的本质
我理解中的Agent就像下面的这句话:
Agent 是一个能在约束条件下,自主完成多步任务的 AI 系统。
这里面有几个词很关键:
自主:不是每一步都要人手把手喂指令。多步任务:不是一次问答就结束。约束条件:Agent 不是完全自由,它要在权限、工具、规则里行动。完成任务:不是“说得像”,而是“真的做完”。
这也是为什么现在很多 Agent 设计,都会强调:
- 规划
- 工具调用
- 记忆
- 反思
- 协作
- 监控与评估
4. Agent 的核心闭环:感知 → 规划 → 行动 → 再感知

4.1 感知
Agent 先接收外部输入,比如:
- 用户需求
- 工具返回结果
- 环境变化
- 任务进度
4.2 规划
Agent 会把目标拆成小步骤。
比如“帮我整理竞品分析报告”,它可能会想:
- 先搜资料
- 再提炼关键维度
- 再对比优劣
- 最后组织成报告
4.3 行动
规划之后,它会调用工具执行:
- 搜索引擎
- 数据库
- 代码执行器
- 邮件接口
- 业务 API
4.4 再感知
执行完不是结束,而是继续观察:
- 成功了吗
- 结果对不对
- 要不要重试
- 计划要不要改
这一步很重要。
没有“再感知”和“纠错”,很多系统只是自动化脚本,不算真正的 Agent。
5. Agent 的基本架构
Agent 架构,通常分为以下 4 个核心块:
5.1 大模型:负责理解与决策
它负责理解任务、做推理、决定下一步做什么。
5.2 工具层:负责把想法变成动作
工具可以是:
- 搜索
- 检索
- 数据库
- 代码执行
- 外部 API
- 浏览器
- 日历、邮件、IM 系统
5.3 记忆层:负责保持上下文
通常可以分成两类:
短期记忆:当前任务执行过程中的状态长期记忆:跨任务的偏好、历史信息、知识沉淀
5.4 控制层:负责调度与约束
这一层决定:
- 什么时候调用哪个工具
- 什么时候停止
- 什么时候让人确认
- 什么时候回滚
- 什么时候换策略
6. Workflow、Agent、Tools区别与联系
感觉这个地方容易搞混,或者说没法很好的说清楚。
6.1 Tools
Tools 是能力本身。
比如搜索、发邮件、查天气、执行 SQL。
6.2 Workflow
Workflow 是流程编排。
它更像“先做 A,再做 B,再做 C”的固定流程。
6.3 Agent
Agent 则更偏向“自己决定下一步怎么做”。
它不是死板地按流程走,而是根据中间结果动态调整。
Tools 是手段,Workflow 是流程,Agent 是会选择流程和手段的执行者。
7. 常见 Agent 设计范式
7.1 ReAct
ReAct 的核心是 Reasoning + Acting。
先思考,再行动,再根据结果继续思考。
它适合那种:
- 需要边查边改
- 信息不确定
- 任务路径不稳定
7.2 Plan-and-Execute
先规划,再逐步执行。
适合长任务、复杂任务、任务拆解很明显的场景。
7.3 Reflection
执行完后,回头检查自己哪里做得不够好。
它的价值在于:
- 降低低级错误
- 提高答案稳定性
- 让系统有“自我修正”的能力
7.4 Multi-Agent
多个 Agent 分工合作。
比如一个负责检索,一个负责总结,一个负责审校。
我的感觉是:
单 Agent 更轻、更简单;
Multi-Agent 更像团队,但复杂度也更高。
9. 吴恩达关于 Agent 的一个观点
吴恩达在谈到 **agentic workflows** 时说过,不要看一个系统是不是Agent,而是看有多agentic。
参考资料
- 小林笔记
- OpenAI 官方文档:Agents / Agents SDK
- Andrew Ng 关于 agentic workflows 的相关公开发言
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)