LangChain4j 的 AI Services 是一个强大的工具,它旨在简化 Java 应用与大语言模型(LLM)的交互过程,将复杂的 AI 能力封装成清晰、易用的 Java API


💡 什么是 AI Services?

AI Services 可以被理解为一个“AI 服务生成器”。你只需要定义一个包含特定业务方法的 Java 接口,并通过注解描述这些方法的行为,LangChain4j 就会在运行时自动生成该接口的实现类(一个代理对象)。

这种声明式编程的模式,与 Spring Data JPARetrofit 的设计思想如出一辙。它让你的业务代码专注于“做什么”,而将“怎么做”(如调用 LLM、处理输入输出、管理对话历史)的复杂性完全隐藏在框架内部。

🛠️ 核心能力:一个注解,无限可能

AI Services 的强大之处在于,它通过一系列注解,将 LLM 应用的常见模式标准化。

注解 / 方法 作用 示例说明
@SystemMessage 设定 LLM 的角色或行为准则 @SystemMessage("你是一个乐于助人的 Java 专家")
@UserMessage 定义发送给 LLM 的用户消息模板 @UserMessage("用中文解释一下:{{it}}")
@MemoryId 标识用于区分不同用户/会话的 ID 方法参数 @MemoryId String userId
@V 定义提示词模板中的变量 方法参数 @V("code") String codeSnippet
AiServices.builder() 为 AI 服务配置 RAG 组件 .contentRetriever(retriever)
AiServices.builder() 为 AI 服务配置工具函数 .tools(new CalculatorTool())
AiServices.builder() 为 AI 服务配置输入/输出护栏 .inputGuardrails(new ProfanityGuardrail())
💬 聊天记忆 (@MemoryId)

有状态的聊天机器人需要记住上下文。你只需在接口方法中增加一个 @MemoryId 参数,并配置一个 ChatMemory 实例,AI Services 便会自动管理每个用户的对话历史。这在构建客服系统时尤其重要,能避免用户重复信息。

@AiService
interface SupportBot {
    String chat(@MemoryId int userId, @UserMessage String userMessage);
}
🛠️ 工具调用 (Function Calling / Tools)

AI Services 允许你将普通的 Java 方法声明为“工具”,让 LLM 能够决定何时调用它们来获取信息或执行动作。这为 LLM 提供了与外部世界交互的接口。

@Tool("获取指定城市的当前天气")
public String getWeather(String city) {
    // ... 调用真实 API 并返回结果
}
📄 输出解析器 (Structured Outputs)

当 LLM 的输出需要被程序进一步处理时,结构化输出至关重要。你可以在接口方法中直接返回一个 Pojo 类型,AI Services 会自动将 LLM 生成的 JSON 文本反序列化为 Java 对象,极大地简化了后续的数据处理。

🚀 如何开始:一个简单的示例

第一步:添加依赖
在你的 pom.xml 文件中,添加 LangChain4j 的核心依赖和 OpenAI 的 Spring Boot Starter。

<dependency>
    <groupId>dev.langchain4j</groupId>
    <artifactId>langchain4j</artifactId>
    <version>1.12.2-beta22</version>
</dependency>
<dependency>
    <groupId>dev.langchain4j</groupId>
    <artifactId>langchain4j-open-ai-spring-boot-starter</artifactId>
    <version>1.12.2-beta22</version>
</dependency>

第二步:定义接口
创建一个 Java 接口,并用 @AiService 注解标记。在其中定义一个方法,并用 @SystemMessage@UserMessage 来指导 AI 的行为。

import dev.langchain4j.service.AiService;
import dev.langchain4j.service.SystemMessage;
import dev.langchain4j.service.UserMessage;

@AiService
public interface Assistant {
    @SystemMessage("你是一个乐于助人的编程助手。")
    @UserMessage("请用中文回答:{{it}}")
    String chat(String userMessage);
}

第三步:注入并使用
在你的业务代码中,可以直接注入并使用这个接口。

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class AIController {
    @Autowired
    private Assistant assistant;

    @GetMapping("/chat")
    public String chat(String message) {
        return assistant.chat(message);
    }
}

🏗️ 真实项目案例:智能客服系统

让我们以构建一个智能客服系统为例,看看 AI Services 如何将各个组件整合起来,解决实际问题。

1. 系统架构

系统的核心是一个由 AI Services 驱动的 CustomerSupportAgent。它集成了多个关键组件:

  • ChatMemory:为每个用户维护独立的对话历史。
  • ContentRetriever (RAG):从公司内部的知识库中检索相关信息,以增强回答的准确性。
  • Tools:连接后端系统,执行具体操作。
2. 核心组件实现

首先,定义一个 CustomerSupportAgent 接口。

@AiService
public interface CustomerSupportAgent {
    String chat(@MemoryId String sessionId, 
                @UserMessage String userMessage, 
                @V("email") String userEmail);
}
  • @MemoryId 用于标识不同用户的会话。
  • @UserMessage 标记了用户输入。
  • @V("email") 定义了模板变量,用于在提示词中动态注入用户邮箱信息。

其次,创建工具类,让 LLM 能够执行具体操作。

public class CustomerSupportTools {
    @Tool("根据订单号查询订单状态")
    public String getOrderStatus(String orderId) { /* 实现查询逻辑 */ }

    @Tool("为用户申请优惠券")
    public String applyCoupon(@P("用户邮箱") String email) { /* 实现申请逻辑 */ }
}
3. 服务组装

最后,在配置类中将所有组件装配起来,创建一个完整的 CustomerSupportAgent Bean。

@Configuration
public class AIConfig {
    @Bean
    CustomerSupportAgent customerSupportAgent(OpenAiChatModel model, 
                                              ContentRetriever retriever) {
        return AiServices.builder(CustomerSupportAgent.class)
            .chatModel(model)
            .chatMemoryProvider(memoryId -> MessageWindowChatMemory.withMaxMessages(10))
            .contentRetriever(retriever)
            .tools(new CustomerSupportTools())
            .build();
    }
}
4. 运行效果

当用户发送“我的订单******为什么还没发货?”时,整个流程会这样运转:

  1. AI Services 接收请求,并自动从 ChatMemory 中加载该用户的对话历史。
  2. RAG 组件从知识库中检索相关发货政策[。
  3. LLM 判断需要调用 getOrderStatus 工具来查询订单状态。
  4. AI Services 执行工具调用,获取真实订单状态。
  5. LLM 综合所有信息,生成自然语言回复,并可通过 applyCoupon 工具主动发放优惠券以安抚用户。

🤔 面临的挑战与解决方案

在实际应用中,AI Services 也会面临一些挑战,以下是常见的几个问题及其解决方案。

1. 模型性能退化

问题:LLM 可能出现准确率下降、响应变慢或“幻觉”增多的情况。
解决方案

  • 监控与可观测性:利用 ModelListener 记录每次调用的耗时、Token 用量等指标,并将其推送到 Prometheus 等监控系统。
  • 快速止损:实施熔断或降级策略,当检测到新模型版本出现问题时,能自动回滚到之前稳定的版本。
  • 持续优化:建立离线评测集,定期对模型进行评估,一旦发现性能退化,能自动触发提示词优化或索引重建流程。
2. 工具调用无限循环

问题:LLM 可能陷入重复调用同一个工具的循环中,消耗大量 Token。
解决方案

  • 限制调用次数:在 AI 服务中配置工具调用的最大次数,避免无限循环。
  • 优化工具描述:为工具提供更精确、清晰的描述,帮助 LLM 更准确地判断何时使用该工具。
3. 输出格式不稳定

问题:LLM 的输出格式不统一,或包含无关内容,使得程序难以解析。
解决方案

  • 使用 Guardrails:配置输出护栏(Output Guardrails),在 LLM 的输出返回给用户前,对其进行格式校验和内容过滤,确保其符合预期。
  • 强化提示词:在提示词中明确要求 LLM 以特定格式(如 JSON)返回数据,并给出示例。
4. 提示词注入与合规性风险

问题:恶意用户可能通过精心构造的输入,试图操纵 LLM 的行为或获取敏感信息。
解决方案

  • 使用 Guardrails:配置输入护栏(Input Guardrails),在用户消息被发送给 LLM 之前,对其进行安全审查和过滤。
  • 内容审核:集成外部的内容审核服务,对输入和输出进行风险识别。
5. 上下文过长

问题:随着对话轮次增多,ChatMemory 积累的上下文可能超过 LLM 的上下文窗口限制。
解决方案

  • 智能裁剪:使用如 MessageWindowChatMemoryTokenWindowChatMemory 等实现,自动丢弃最旧的消息,或将历史消息进行摘要压缩,以保持在限制之内
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐