1. 什么是大模型 Agent?

1.1 Agent 不是一个“更大的模型”,而是一套能执行任务的系统

大模型 Agent 可以理解为:以大语言模型为“大脑”,再配上工具、记忆、规划和执行控制,让系统不只是回答问题,而是能够围绕一个目标持续行动。普通问答模型通常是“输入一句话,输出一段话”;Agent 则更像“输入一个目标,系统自己判断下一步该做什么”。

举个简单例子:你问普通模型“帮我查一下库存再做补货建议”,它如果没有工具,只能根据已有知识泛泛回答;而 Agent 可以先判断要查库存系统,再调用数据库或 API,拿到结果后继续分析,最后给出补货建议。

1.2 Agent 的核心能力:决策、行动、观察、迭代

Agent 最核心的能力不是“会说”,而是“会做”。它会先理解目标,再决定是否调用工具;工具返回结果后,模型会观察结果是否满足目标,如果不满足,就继续下一轮决策。这个过程就是 Agent 的经典执行循环。

2. 结合 LangChain,说明大模型 Agent 由哪些部分组成

2.1 Model:Agent 的“大脑”

Model 负责理解用户意图、判断任务步骤、生成工具调用参数,并把工具返回结果整合成最终回答。没有模型,Agent 就没有推理和决策能力。

2.2 Tools:Agent 的“手脚”

Tools 是 Agent 连接外部世界的接口,比如搜索、数据库查询、HTTP API、代码执行器、企业内部系统等。工具的定义必须清楚,包括工具名称、工具描述、输入参数和返回结果,否则模型容易调用错工具或传错参数。

2.3 Prompt:Agent 的“操作规程”

Prompt 用来告诉 Agent 它是谁、要遵守什么规则、什么时候可以调用工具、输出格式是什么、遇到不确定信息时该怎么办。一个 Agent 能否稳定运行,Prompt 约束非常关键。

2.4 Memory / Chat Message History:Agent 的“上下文”

Memory 负责保存对话历史、任务状态、用户偏好或长期知识。短期记忆解决当前会话连续性,长期记忆解决跨会话个性化和稳定背景复用。但记忆不是越多越好,过多历史会带来成本增加、上下文污染和旧信息干扰。

2.5 Executor / Runtime:Agent 的“执行控制器”

Executor 负责把模型的决策真正跑起来:调用工具、处理返回结果、继续下一轮、判断是否停止、处理异常、记录日志。它不是模型本身,而是把模型和工具串成可控流程的运行时。

3. LangChain Agent 类型有哪些?

3.1 ReAct Agent:边想边做

ReAct 的核心思想是把推理和行动交替进行:模型先分析当前问题,再选择一个动作,工具返回观察结果后,模型继续分析下一步。它适合解释性强、步骤清晰、需要多轮工具调用的任务。

3.2 Tool Calling Agent:现代工程里更常见

Tool Calling Agent 更强调模型输出结构化工具调用请求。相比让模型用自然语言描述动作,结构化调用更容易做参数校验、权限控制和稳定执行。现代支持工具调用的模型,通常更适合这种方式。

3.3 Plan-and-Execute:适合长任务

Plan-and-Execute 会先规划完整步骤,再逐步执行。这种方式适合复杂任务,比如多文档分析、长流程自动化、数据处理等。但它的缺点也很明显:链路长、延时高、容易中途偏离,需要更强的状态管理和中间校验。

3.4 Multi-Agent 与 LangGraph

当任务太复杂,单个 Agent 很难稳定完成时,可以拆成多个 Agent 分工协作,比如规划 Agent、执行 Agent、审核 Agent、总结 Agent。生产级复杂 Agent 系统,往往还需要图结构、状态持久化和可恢复执行,这也是 LangGraph 这类框架的价值所在。

4. LangChain Agent 创建方式

4.1 新版本常见思路:create_agent

在较新的 LangChain 文档里,create_agent 是更推荐的 Agent 创建入口。创建思路非常清楚:先选择模型,再定义工具,再设置系统提示词,最后把这些组件组合成一个可运行的 Agent。

4.2 经典项目常见思路:Agent + Tools + AgentExecutor

很多老项目或旧教程里,还会看到 AgentExecutor。它的思路也很好理解:Agent 负责计划和选择动作,Tools 负责实际执行动作,AgentExecutor 负责把它们放进循环里运行。

4.3 面试时怎么处理版本差异?

最稳的说法是:新版本 LangChain 更强调 create_agent 这类更统一的入口;但在经典项目里,AgentExecutor 仍然是理解 Agent 运行机制的重要概念。它们的本质目标一致,都是把模型决策和工具执行串成可控流程。

5. 什么是 AgentExecutor?

5.1 AgentExecutor 不是 Agent 本身,而是执行器

AgentExecutor 可以理解成“运行 Agent 的外壳”。Agent 负责决定下一步要做什么,Tools 负责执行具体动作,而 AgentExecutor 负责循环调度、把工具结果交回模型、判断是否继续、控制最大轮数、处理异常和返回最终结果。

5.2 为什么需要 AgentExecutor?

如果没有执行器,模型只会告诉你“我想调用某个工具”,但不会真正形成可控的运行闭环。执行器的价值就是把模型输出的动作变成真实动作,并把真实世界的结果再次送回模型。

5.3 AgentExecutor 的创建方式

经典创建方式通常包括三步:第一,准备模型和 Prompt;第二,定义工具列表;第三,把 Agent 和工具交给 AgentExecutor。运行时,Executor 会不断重复“模型决策—工具执行—观察结果—继续决策”的过程,直到模型给出最终答案或达到迭代上限。

6. 大模型 Agent 实现思路

6.1 Demo 级 Agent 和生产级 Agent 的区别

Demo 级 Agent 通常只需要一个模型、几个工具和一个简单 Prompt;生产级 Agent 则必须考虑权限、状态、失败重试、日志追踪、成本控制、模型路由、人工兜底和安全审计。

6.2 一个生产级 Agent 的分层设计

可以分成七层:用户入口层、意图与权限层、Agent 编排层、工具执行层、记忆与状态层、质量安全层、观测评估层。这样设计的好处是职责清晰,出了问题能定位,后续扩展也更稳。

7. 如何给 LLM 注入领域知识?

7.1 不同知识,适合不同注入方式

给 LLM 注入领域知识,不能只想到微调。更合理的方式是先判断知识类型:如果是频繁更新的文档知识,优先用 RAG;如果是实时业务数据,优先用工具或数据库查询;如果是稳定的表达风格和任务格式,才更适合微调;如果是用户长期偏好,可以用长期记忆;如果只是临时规则,Prompt 就够了。

7.2 RAG 和工具调用的区别

RAG 更适合从文档中找答案,比如企业制度、产品手册、知识库;工具调用更适合查询实时数据,比如库存、订单、价格、权限状态。RAG 解决的是“知识文档在哪里”,工具解决的是“实时系统怎么查”。

7.3 微调不是知识更新的万能药

很多人把微调当成注入知识的唯一方式,这是误区。微调更适合让模型学会稳定风格、固定格式和任务习惯,不适合频繁变化的事实。对于会更新的知识,RAG 和工具通常更灵活。

8. 面试高频追问,建议这样回答

8.1 什么是大模型 Agent?

答:大模型 Agent 是以 LLM 为核心,结合工具、记忆、规划和执行器组成的任务执行系统。它不只是回答问题,而是能根据目标选择工具、执行动作、观察结果,并迭代完成任务。

8.2 LangChain Agent 由哪些部分组成?

答:通常包括 Model、Tools、Prompt、Memory / Message History、Executor / Runtime。模型负责决策,工具负责行动,Prompt 负责约束,Memory 负责上下文,Executor 负责循环执行和控制。

8.3 LangChain Agent 类型有哪些?

答:常见有 ReAct Agent、Tool Calling Agent、Structured Chat Agent、Plan-and-Execute、多 Agent 协同以及基于 LangGraph 的图式 Agent。不同类型适合不同复杂度和稳定性要求。

8.4 AgentExecutor 是什么?

答:AgentExecutor 是运行 Agent 的执行器。它把 Agent 和工具放进一个循环里,负责调用工具、接收观察结果、继续迭代、判断停止条件和处理错误。

8.5 大模型 Agent 实现思路是什么?

答:从工程上看,需要有用户入口、权限校验、Agent 编排、工具调用、记忆状态、质量安全和观测评估等层。Demo 只需要模型和工具,生产系统必须补齐控制与兜底。

8.6 如何给 LLM 注入领域知识?

答:按知识类型选择方案。文档知识用 RAG,实时数据用工具或数据库查询,稳定任务风格用微调,长期偏好用记忆,临时规则用 Prompt。

9. 总结:Agent 面试题真正考的是“模型如何进入真实世界”

如果把这组问题浓缩成一句话,那就是:Agent 是让大模型从“会回答”升级到“会做事”的工程系统。LangChain 的价值,是把模型、工具、Prompt、记忆、检索和执行流程变成可组合组件,让开发者更快构建 Agent 应用。

真正高质量的回答,不是背“Agent 是什么”,而是能讲清它由哪些部分组成、为什么需要执行器、有哪些 Agent 类型、怎么创建、怎么落地到生产系统,以及如何通过 RAG、工具、微调和记忆注入领域知识。只要这条线讲顺,Agent 相关面试题基本都能接住。

附:30 秒面试快答模板

“大模型 Agent 是以 LLM 为核心,结合工具、记忆、Prompt 和执行器组成的任务执行系统。LangChain Agent 通常由 Model、Tools、Prompt、Memory 和 Executor 组成。模型负责判断下一步做什么,工具负责连接外部系统,执行器负责把模型决策和工具执行串成循环。Agent 类型包括 ReAct、Tool Calling、Plan-and-Execute、多 Agent 等。生产级 Agent 还要考虑权限、状态、日志、失败重试、成本和安全。领域知识可以通过 RAG、工具查询、微调、记忆和 Prompt 分层注入。”

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐