面试题：LangChain Agent 相关全解析——大模型 Agent、AgentExecutor、创建方式、实现思路与领域知识注入

闵浮龙

114人浏览 · 2026-05-17 15:24:38

闵浮龙 · 2026-05-17 15:24:38 发布

1. 什么是大模型 Agent？

1.1 Agent 不是一个“更大的模型”，而是一套能执行任务的系统

大模型 Agent 可以理解为：以大语言模型为“大脑”，再配上工具、记忆、规划和执行控制，让系统不只是回答问题，而是能够围绕一个目标持续行动。普通问答模型通常是“输入一句话，输出一段话”；Agent 则更像“输入一个目标，系统自己判断下一步该做什么”。

举个简单例子：你问普通模型“帮我查一下库存再做补货建议”，它如果没有工具，只能根据已有知识泛泛回答；而 Agent 可以先判断要查库存系统，再调用数据库或 API，拿到结果后继续分析，最后给出补货建议。

1.2 Agent 的核心能力：决策、行动、观察、迭代

Agent 最核心的能力不是“会说”，而是“会做”。它会先理解目标，再决定是否调用工具；工具返回结果后，模型会观察结果是否满足目标，如果不满足，就继续下一轮决策。这个过程就是 Agent 的经典执行循环。

2. 结合 LangChain，说明大模型 Agent 由哪些部分组成

2.1 Model：Agent 的“大脑”

Model 负责理解用户意图、判断任务步骤、生成工具调用参数，并把工具返回结果整合成最终回答。没有模型，Agent 就没有推理和决策能力。

2.2 Tools：Agent 的“手脚”

Tools 是 Agent 连接外部世界的接口，比如搜索、数据库查询、HTTP API、代码执行器、企业内部系统等。工具的定义必须清楚，包括工具名称、工具描述、输入参数和返回结果，否则模型容易调用错工具或传错参数。

2.3 Prompt：Agent 的“操作规程”

Prompt 用来告诉 Agent 它是谁、要遵守什么规则、什么时候可以调用工具、输出格式是什么、遇到不确定信息时该怎么办。一个 Agent 能否稳定运行，Prompt 约束非常关键。

2.4 Memory / Chat Message History：Agent 的“上下文”

Memory 负责保存对话历史、任务状态、用户偏好或长期知识。短期记忆解决当前会话连续性，长期记忆解决跨会话个性化和稳定背景复用。但记忆不是越多越好，过多历史会带来成本增加、上下文污染和旧信息干扰。

2.5 Executor / Runtime：Agent 的“执行控制器”

Executor 负责把模型的决策真正跑起来：调用工具、处理返回结果、继续下一轮、判断是否停止、处理异常、记录日志。它不是模型本身，而是把模型和工具串成可控流程的运行时。

3. LangChain Agent 类型有哪些？

3.1 ReAct Agent：边想边做

ReAct 的核心思想是把推理和行动交替进行：模型先分析当前问题，再选择一个动作，工具返回观察结果后，模型继续分析下一步。它适合解释性强、步骤清晰、需要多轮工具调用的任务。

3.2 Tool Calling Agent：现代工程里更常见

Tool Calling Agent 更强调模型输出结构化工具调用请求。相比让模型用自然语言描述动作，结构化调用更容易做参数校验、权限控制和稳定执行。现代支持工具调用的模型，通常更适合这种方式。

3.3 Plan-and-Execute：适合长任务

Plan-and-Execute 会先规划完整步骤，再逐步执行。这种方式适合复杂任务，比如多文档分析、长流程自动化、数据处理等。但它的缺点也很明显：链路长、延时高、容易中途偏离，需要更强的状态管理和中间校验。

3.4 Multi-Agent 与 LangGraph

当任务太复杂，单个 Agent 很难稳定完成时，可以拆成多个 Agent 分工协作，比如规划 Agent、执行 Agent、审核 Agent、总结 Agent。生产级复杂 Agent 系统，往往还需要图结构、状态持久化和可恢复执行，这也是 LangGraph 这类框架的价值所在。

4. LangChain Agent 创建方式

4.1 新版本常见思路：create_agent

在较新的 LangChain 文档里，create_agent 是更推荐的 Agent 创建入口。创建思路非常清楚：先选择模型，再定义工具，再设置系统提示词，最后把这些组件组合成一个可运行的 Agent。

4.2 经典项目常见思路：Agent + Tools + AgentExecutor

很多老项目或旧教程里，还会看到 AgentExecutor。它的思路也很好理解：Agent 负责计划和选择动作，Tools 负责实际执行动作，AgentExecutor 负责把它们放进循环里运行。

4.3 面试时怎么处理版本差异？

最稳的说法是：新版本 LangChain 更强调 create_agent 这类更统一的入口；但在经典项目里，AgentExecutor 仍然是理解 Agent 运行机制的重要概念。它们的本质目标一致，都是把模型决策和工具执行串成可控流程。

5. 什么是 AgentExecutor？

5.1 AgentExecutor 不是 Agent 本身，而是执行器

AgentExecutor 可以理解成“运行 Agent 的外壳”。Agent 负责决定下一步要做什么，Tools 负责执行具体动作，而 AgentExecutor 负责循环调度、把工具结果交回模型、判断是否继续、控制最大轮数、处理异常和返回最终结果。

5.2 为什么需要 AgentExecutor？

如果没有执行器，模型只会告诉你“我想调用某个工具”，但不会真正形成可控的运行闭环。执行器的价值就是把模型输出的动作变成真实动作，并把真实世界的结果再次送回模型。

5.3 AgentExecutor 的创建方式

经典创建方式通常包括三步：第一，准备模型和 Prompt；第二，定义工具列表；第三，把 Agent 和工具交给 AgentExecutor。运行时，Executor 会不断重复“模型决策—工具执行—观察结果—继续决策”的过程，直到模型给出最终答案或达到迭代上限。

6. 大模型 Agent 实现思路

6.1 Demo 级 Agent 和生产级 Agent 的区别

Demo 级 Agent 通常只需要一个模型、几个工具和一个简单 Prompt；生产级 Agent 则必须考虑权限、状态、失败重试、日志追踪、成本控制、模型路由、人工兜底和安全审计。

6.2 一个生产级 Agent 的分层设计

可以分成七层：用户入口层、意图与权限层、Agent 编排层、工具执行层、记忆与状态层、质量安全层、观测评估层。这样设计的好处是职责清晰，出了问题能定位，后续扩展也更稳。

7. 如何给 LLM 注入领域知识？

7.1 不同知识，适合不同注入方式

给 LLM 注入领域知识，不能只想到微调。更合理的方式是先判断知识类型：如果是频繁更新的文档知识，优先用 RAG；如果是实时业务数据，优先用工具或数据库查询；如果是稳定的表达风格和任务格式，才更适合微调；如果是用户长期偏好，可以用长期记忆；如果只是临时规则，Prompt 就够了。

7.2 RAG 和工具调用的区别

RAG 更适合从文档中找答案，比如企业制度、产品手册、知识库；工具调用更适合查询实时数据，比如库存、订单、价格、权限状态。RAG 解决的是“知识文档在哪里”，工具解决的是“实时系统怎么查”。

7.3 微调不是知识更新的万能药

很多人把微调当成注入知识的唯一方式，这是误区。微调更适合让模型学会稳定风格、固定格式和任务习惯，不适合频繁变化的事实。对于会更新的知识，RAG 和工具通常更灵活。

8. 面试高频追问，建议这样回答

8.1 什么是大模型 Agent？

答：大模型 Agent 是以 LLM 为核心，结合工具、记忆、规划和执行器组成的任务执行系统。它不只是回答问题，而是能根据目标选择工具、执行动作、观察结果，并迭代完成任务。

8.2 LangChain Agent 由哪些部分组成？

答：通常包括 Model、Tools、Prompt、Memory / Message History、Executor / Runtime。模型负责决策，工具负责行动，Prompt 负责约束，Memory 负责上下文，Executor 负责循环执行和控制。

8.3 LangChain Agent 类型有哪些？

答：常见有 ReAct Agent、Tool Calling Agent、Structured Chat Agent、Plan-and-Execute、多 Agent 协同以及基于 LangGraph 的图式 Agent。不同类型适合不同复杂度和稳定性要求。

8.4 AgentExecutor 是什么？

答：AgentExecutor 是运行 Agent 的执行器。它把 Agent 和工具放进一个循环里，负责调用工具、接收观察结果、继续迭代、判断停止条件和处理错误。

8.5 大模型 Agent 实现思路是什么？

答：从工程上看，需要有用户入口、权限校验、Agent 编排、工具调用、记忆状态、质量安全和观测评估等层。Demo 只需要模型和工具，生产系统必须补齐控制与兜底。

8.6 如何给 LLM 注入领域知识？

答：按知识类型选择方案。文档知识用 RAG，实时数据用工具或数据库查询，稳定任务风格用微调，长期偏好用记忆，临时规则用 Prompt。

9. 总结：Agent 面试题真正考的是“模型如何进入真实世界”

如果把这组问题浓缩成一句话，那就是：Agent 是让大模型从“会回答”升级到“会做事”的工程系统。LangChain 的价值，是把模型、工具、Prompt、记忆、检索和执行流程变成可组合组件，让开发者更快构建 Agent 应用。

真正高质量的回答，不是背“Agent 是什么”，而是能讲清它由哪些部分组成、为什么需要执行器、有哪些 Agent 类型、怎么创建、怎么落地到生产系统，以及如何通过 RAG、工具、微调和记忆注入领域知识。只要这条线讲顺，Agent 相关面试题基本都能接住。

附：30 秒面试快答模板

“大模型 Agent 是以 LLM 为核心，结合工具、记忆、Prompt 和执行器组成的任务执行系统。LangChain Agent 通常由 Model、Tools、Prompt、Memory 和 Executor 组成。模型负责判断下一步做什么，工具负责连接外部系统，执行器负责把模型决策和工具执行串成循环。Agent 类型包括 ReAct、Tool Calling、Plan-and-Execute、多 Agent 等。生产级 Agent 还要考虑权限、状态、日志、失败重试、成本和安全。领域知识可以通过 RAG、工具查询、微调、记忆和 Prompt 分层注入。”

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

从词嵌入到RNN（其一）

AtomGit开源社区

AI Agent Harness Engineering 私有化部署：难点、成本与最佳实践

本文将带你深入探讨AI Agent Harness Engineering私有化部署的全过程。我们将从什么是AI Agent Harness Engineering开始，逐步深入到私有化部署的技术难点、成本分析，最后分享业界的最佳实践。AI Agent Harness Engineering的核心概念和架构私有化部署的必要性和适用场景技术栈选择和环境准备部署过程中的关键难点和解决方案成本构成分析和

AtomGit开源社区

ragflow v0.25.4 版本更新：RESTful API 数据源连接器、Agent 标签管理、Widget 持久化、GPT-5.4 模型支持全面升级

本次更新中，Widget 自定义和持久化也是一个非常值得关注的改进点。Widget 往往是界面中承担展示、操作或信息汇总功能的组件。能够自定义 Widget，说明用户可以根据自己的使用习惯或业务需求，对界面组件进行更灵活的配置。这会让界面更贴近实际使用，而不是只停留在固定布局和固定展示方式上。这一项已经在前面详细说明，本次更新明确包含了这项能力，说明它是本版的重要改进之一。代码地址：github.