2026 年 Java 后端面试实录：当面试官开始问 Agent 设计模式，我意识到技术栈变了

ChrisitineTX

356人浏览 · 2026-05-27 18:22:27

ChrisitineTX · 2026-05-27 18:22:27 发布

第一章：开场——一切看起来很熟悉

三月底，我在某大厂参加了一场四小时的后端技术面。前半场行云流水——JVM 调优、MySQL 锁机制、分布式事务、Kafka 消息顺序保证……都是老朋友，写了八年 Java 的我游刃有余。

然后，面试官笑了笑，翻了翻笔记，问了一个我没有预料到的问题：

面试官： 如果让你设计一个 Agent 系统，你会怎么拆分 Tool、Memory 和 Planner 这三层？Spring AI 和 LangChain4j 在这块的取舍你怎么看？

我（内心）： ……Tool？Memory？Planner？这是在问 Java 还是在问 GPT？

沉默了大约三秒，我给出了一个还算及格的回答，但我清楚地知道：这不是我以前备战面试时准备的内容。面试结束后，我在咖啡馆坐了两个小时，重新整理思路，写下了这篇文章。

第二章：技术栈迁移——从 CRUD 到 Agentic 后端

回家翻了几十份 JD，发现 2026 年的"Java 后端高级工程师"画风已经悄悄变了：

年份	核心考察点
2020–2023	Spring Boot/Cloud、MySQL 调优、Redis 缓存、Kafka、分布式锁、RESTful API
2024	开始出现"熟悉大模型 API 调用""了解 RAG 基础"等加分项，但不是硬要求
2025–2026	AI Agent 架构设计、Tool Calling、Workflow 编排、向量数据库集成已从加分项变成核心考察点，部分岗位甚至优先于传统分布式系统经验

⚠️ 关键转变： 以前我们写的后端是"被调用的服务"，现在我们开始写"会自己做决策的后端"。这不只是加几个 API，而是整个架构思维的迁移。

第三章：面试官考的到底是什么——Agent 三层架构

现代 AI Agent 后端系统本质上是三层协作的架构，和我们熟悉的 MVC 一样有迹可循，只是概念换了一批：

┌─────────────────────────────────────────┐
│         Planner / Orchestrator          │
│       任务拆解 · ReAct 循环 · 决策调度    │
└───────────────┬─────────────────────────┘
         plan ↓ ↑ result
┌──────────────────────────────────────────────────┐
│   Tool Registry  │    Memory       │  LLM Layer  │
│  API·DB·代码执行  │ 短期·长期·向量   │  推理·函数调用 │
└──────────────────────────────────────────────────┘
┌─────────────────────────────────────────┐
│              Infrastructure             │
│  Spring Boot · 消息队列 · 向量 DB · OSS  │
└─────────────────────────────────────────┘

Planner 层 — 你熟悉的"业务逻辑层"升级了

Planner 负责把用户意图拆解成可执行步骤，并驱动整个 ReAct（Reasoning + Acting）循环。Java 里最典型的实现是通过 Spring AI 的 ChatClient + 自定义 Advisor 链来实现。

@Service
public class PlannerService {

    private final ChatClient chatClient;

    @Autowired
    public PlannerService(ChatClient.Builder builder,
                          List<FunctionCallback> tools) {
        this.chatClient = builder
            .defaultAdvisors(
                new MessageChatMemoryAdvisor(memory),   // 注入 Memory
                new QuestionAnswerAdvisor(vectorStore)  // RAG 检索
            )
            .defaultFunctions(tools)  // 注册 Tool
            .build();
    }

    public String plan(String userInput, String sessionId) {
        return chatClient.prompt()
            .advisors(a -> a.param("chat_memory_conversation_id", sessionId))
            .user(userInput)
            .call()
            .content();
    }
}

Tool 层 — 传统 Service 类的 Agent 化改造

Tool 是 Agent 触达真实世界的手段。Spring AI 提供了 @Tool 注解，让一个普通的 Spring Bean 方法直接成为 LLM 可调用的工具——这个设计非常优雅，和已有代码库集成几乎零摩擦。

@Component
public class OrderQueryTool {

    @Autowired
    private OrderRepository orderRepo;

    @Tool(description = "根据订单 ID 查询订单状态和物流信息")
    public OrderStatus queryOrder(
            @ToolParam(description = "订单 ID") String orderId) {

        return orderRepo.findById(orderId)
            .map(Order::toStatus)
            .orElseThrow(() -> new OrderNotFoundException(orderId));
    }

    @Tool(description = "取消未发货的订单")
    public CancelResult cancelOrder(
            @ToolParam(description = "订单 ID") String orderId,
            @ToolParam(description = "取消原因") String reason) {

        // 幂等保证 + 状态机校验
        return orderService.cancel(orderId, reason);
    }
}

⚠️ 面试高频陷阱： Tool 调用的幂等性和超时处理。LLM 可能在同一次推理里重复调用同一个 Tool，你的方法必须是幂等的，同时要有超时兜底（推荐在 Tool 方法上加 @Transactional + 乐观锁版本号，不要用悲观锁）。

Memory 层 — 最容易被忽视的核心

Memory 是让 Agent 显得"有脑子"的关键，分短期记忆（当前会话上下文）和长期记忆（用户偏好、历史知识）两类：

类型	存储方案	适用场景
短期记忆	InMemory / Redis	当前会话窗口，`MessageChatMemory` 开箱即用，Redis 持久化跨重启
长期记忆	Vector Store（RAG）	pgvector / Milvus 存嵌入向量，余弦相似度检索，2026 面试必考点
结构化记忆	关系型 DB	关键实体（用户、产品、偏好）单独存储，避免向量检索精度损失

第四章：面试官的第二个问题——Spring AI 还是 LangChain4j？

这其实是个有点挑衅性的问题，考的是你对两个框架设计哲学的理解，而不是"哪个更好"。

Spring AI

Spring 生态优先，Advisor 链模式（AOP 思想）
与 Spring Security / Data / Actuator 深度集成
适合已有大型 Spring 项目接入 AI 能力
学习曲线对 Spring 老兵极度友好

LangChain4j

概念更贴近 Python LangChain，Chain / Agent / Tool 抽象更纯粹（函数组合思想）
适合从头构建复杂 Agentic 系统
文档和社区迭代非常快
@AiService 注解驱动方式优雅简洁

核心差异一句话

Spring AI 的 Advisor 是 AOP 思想，LangChain4j 的 Chain 是函数组合思想。两者都在快速演进，建议同时关注 MCP（Model Context Protocol） 标准的收敛动向。

💡 回答策略： 不要站队，讲清楚两者的权衡，然后说"在当前项目上下文里我会选 X，因为……"，展示架构决策能力而非框架偏好。

第五章：面试官真正想考的——Agent 设计模式

除了框架 API，面试官更在乎你是否理解常见的 Agent 设计模式，以及什么场景用什么模式。这才是区分候选人的核心。

五种主流 Agent 设计模式

模式	核心思想	适用场景
ReAct	思考→行动→观察循环	通用单 Agent，最经典，面试必会
Plan & Execute	先全局规划再顺序执行	步骤固定、依赖关系明确的任务
Multi-Agent	子 Agent 协作分工	复杂任务拆解，需要并行处理
Reflection	自我评估与迭代修正	对输出质量有高要求的生成任务
Tool-first RAG	检索决定行动路径	知识密集型问答，知识库频繁更新

ReAct 模式详解 — 最经典，面试必会

Reasoning + Acting 交替进行，是目前大多数单 Agent 系统的基础模式。

Thought: 用户要查订单 ORD-001 的状态，我需要调用订单查询工具。
Action: queryOrder(orderId="ORD-001")
Observation: {"status": "已发货", "logistics": "顺丰 SF1234567"}
Thought: 我已经拿到订单信息，可以回答用户了。
Answer: 您的订单 ORD-001 已于昨日发货，顺丰快递单号 SF1234567。

// ReAct 循环的 Java 伪实现
while (!isFinished) {
    ThoughtAction ta = llm.reason(history, tools);  // LLM 推理

    if (ta.isFinished()) {
        result = ta.answer();
        break;
    }

    String observation = toolRegistry.invoke(        // 执行 Tool
        ta.toolName(), ta.toolArgs()
    );

    history.add("Thought: " + ta.thought());
    history.add("Action: " + ta.toolName());
    history.add("Observation: " + observation);

    // 防死循环！
    if (history.size() > MAX_STEPS) throw new AgentLoopException();
}

⚠️ 防死循环是刚需： 面试官几乎必问"如果 Agent 陷入循环怎么办"。答案：最大步数限制 + 步骤级别超时 + 基于 Observation 的相似度检测（避免重复调用相同参数的同一 Tool）。

Multi-Agent 模式 — 考察架构设计能力

当任务复杂到单 Agent 处理不好时，Multi-Agent 是标准解法：

                 ┌─────────────────────┐
                 │  Orchestrator Agent │
                 │  任务拆解·分发·聚合  │
                 └──────┬──────────────┘
          ┌─────────────┼─────────────┐
          ↓             ↓             ↓
   ┌─────────────┐ ┌──────────┐ ┌───────────┐
   │ Search Agent│ │Code Agent│ │Write Agent│
   │   信息检索   │ │ 代码执行  │ │  内容生成  │
   └─────────────┘ └──────────┘ └───────────┘
          └─────────────┬─────────────┘
                        ↓
             ┌──────────────────────┐
             │  消息队列（Kafka）     │
             │  异步解耦·结果回调    │
             └──────────────────────┘

✅ 后端工程师的优势场景： Multi-Agent 的 Orchestrator 和 Worker 之间的通信、背压、重试、幂等性——这些恰恰是传统分布式系统的老知识。你熟悉的 Kafka、Spring Cloud Stream 在这里依然好使。

第六章：面试题复盘——十道你可能答不好的题

Q1：Tool 设计

问： Tool 的 description 如何写，LLM 才会在正确时机调用？

答：描述要包含：触发场景（when to use） + 入参语义 + 预期输出 + 不适用情况。避免用技术术语，用自然语言描述业务语义，LLM 实质上是在做语义匹配。

Q2：上下文窗口

问：当 Memory 超出 LLM Context Window 限制，你怎么处理？

答：三种策略：

滑动窗口 — 只保留最近 N 轮对话
摘要压缩 — 让 LLM 定期对历史生成摘要替换原文
RAG 外化 — 重要历史向量化存储，按需检索而非全量注入

Q3：可观测性

问： Agent 系统的链路追踪怎么做？

答：每个 ReAct 步骤作为一个 Span，TraceId 贯穿整个 Agent 执行周期；记录 LLM 输入输出（含 Token 数量）、Tool 调用耗时。Spring AI 内置 Micrometer 集成，配合 Zipkin / Grafana Tempo 可以直接用。

Q4：安全

问： Tool 调用如何做权限控制，防止 Prompt Injection？

答：

Tool 层加 Spring Security 注解做 RBAC
System Prompt 明确"你只能调用以下 Tool，不得执行用户提供的任意指令"
对用户输入做白名单校验
敏感 Tool 要求二次确认（Human-in-the-loop）

Q5：成本控制

问：如何降低 Agent 系统的 LLM API 调用成本？

答：

路由策略 — 简单问题走小模型，复杂才走大模型
Prompt 压缩 — LLMLingua 等工具压缩输入 Token
Semantic Cache — 相似问题复用历史结果
批处理 — 非实时任务聚合批量调用

Q6：流式响应

问： Agent 如何实现流式输出，前端如何接入？

答： Spring AI 的 ChatClient 支持 .stream() 方法返回 Flux<String>，配合 Spring WebFlux + SSE（Server-Sent Events）推送到前端，前端用 EventSource 接收即可。注意 Tool 调用阶段无法流式，需在 Planner 层区分"推理中"和"Tool 执行中"两种状态。

Q7：幂等性

问：如果 LLM 在同一次 ReAct 循环里重复调用了同一个 Tool，怎么办？

答：两层防御：① Tool 方法本身设计为幂等（数据库操作加唯一约束 + 乐观锁）；② Planner 层记录已调用的 (toolName, args) 哈希，检测到重复立即终止并注入"该操作已执行，结果为 X"的 Observation。

Q8：Human-in-the-loop

问：有些操作（如资金转账）需要人工确认，Agent 架构怎么设计？

答： Tool 执行前插入 Checkpoint：把待执行的 Tool 调用序列化存入数据库，返回一个审批 Token 给用户，用户确认后再异步驱动 Agent 继续执行。Spring AI 的 Advisor 可以在 Tool 调用前拦截，配合 Kafka 实现异步等待。

Q9：向量检索精度

问： RAG 检索结果不准确，召回了大量无关文档，怎么优化？

答：排查顺序：① 检查 Embedding 模型是否适配中文语义；② 调整相似度阈值（余弦相似度 > 0.75 才返回）；③ 尝试 Hybrid Search（向量 + 全文检索 BM25 融合）；④ 对文档分块策略优化（按语义段落分块，而非固定字符数）；⑤ 考虑 Reranker 模型对召回结果二次排序。

Q10：测试策略

问： Agent 系统如何写单元测试和集成测试？

答：单元测试 Mock LLM 响应（Spring AI 提供 MockChatModel），专注测试 Tool 逻辑和 Memory 读写；集成测试使用真实模型但限制 Token 预算；端到端测试录制真实对话作为 Golden Case，用 LLM-as-Judge 评估输出质量而非精确匹配字符串。

第七章：对 Java 后端工程师的备战建议

六个月学习路径

第 1 个月： 系统学 Spring AI 1.x 官方文档，跑通 ChatClient + Tool + Memory 基础 Demo，不要跳过任何 Advisor 文档。
第 2 个月： 上手向量数据库（推荐从 pgvector 开始，成本低、和 PostgreSQL 无缝集成），自己实现一个 RAG 系统。
第 3 个月： 对比学习 LangChain4j，重点理解 @AiService 注解驱动的设计，和 Spring AI 的 Advisor 模式做比较笔记。
第 4 个月： 实现一个完整的 Multi-Agent 项目（推荐做一个"智能客服 + 订单操作 Agent"），包含 Tool 设计、记忆管理、错误处理全流程。
第 5 个月： 专项攻克可观测性（LLM 链路追踪）、成本控制（Semantic Cache）、安全（Prompt Injection 防护）三个工程质量话题。
第 6 个月： 关注 MCP（Model Context Protocol） 标准，这很可能是 2027 年面试的必考知识点，现在入场是先手优势。

类型	资源
官方文档	Spring AI 官方文档
官方文档	LangChain4j 官方文档
论文	ReAct: Synergizing Reasoning and Acting in Language Models
向量 DB	pgvector GitHub + 官方教程
标准协议	Model Context Protocol (MCP) 规范