Langchain与RAG

CoderIsArt

337人浏览 · 2026-03-20 15:42:45

CoderIsArt · 2026-03-20 15:42:45 发布

LangChain是一个强大的开源框架，专为简化基于大语言模型（LLM）的应用开发而设计。它通过提供统一的接口和模块化组件，让开发者能够轻松地将LLM与外部数据源、API和各种工具集成，从而构建出功能更加强大和智能的应用程序，例如检索增强生成（RAG）系统。

下面将从安装开始，逐步深入LangChain的核心组件及其在RAG中的设计与应用。

📦 LangChain安装与快速上手

LangChain的安装非常简便，主要通过Python的包管理工具pip完成。在开始之前，请确保你的环境中已安装Python 3.10或更高版本。

1. 安装步骤

打开终端，执行以下命令即可安装LangChain的基础库：

bash

pip install langchain

这个命令会安装LangChain的核心包以及一些基础的依赖，如langchain-core、langchain-text-splitters等。

2. 安装模型集成包

LangChain本身不包含LLM，你需要根据想要使用的模型提供商安装对应的集成包。

通用示例：对于支持OpenAI兼容API的模型（如DeepSeek、阿里的Qwen等），通常安装OpenAI库即可。
特定平台：如果使用特定云服务商的模型，需要安装对应的包。
- Oracle OCI: pip install langchain-oci
- IBM watsonx: pip install langchain-ibm
- Google Gemini: pip install langchain[google-genai]

3. 快速验证

安装完成后，可以通过一个简单的Python脚本来验证环境是否配置成功。以下示例展示了如何接入一个兼容OpenAI API的模型（如Qwen）并获取回答：

python

from langchain.chat_models import init_chat_model
from langchain_core.messages import HumanMessage

# 初始化模型（请替换为你的API密钥和基础URL）
model = init_chat_model(
    "Qwen/Qwen2.5-7B-Instruct",
    model_provider="openai",
    api_key="YOUR_API_KEY",
    base_url="YOUR_API_BASE_URL"
)

# 调用模型
response = model.invoke([HumanMessage(content="用一句话解释什么是大语言模型？")])
print(response.content)

🧱 LangChain核心组件

LangChain的强大之处在于其模块化的设计。理解这几个核心组件是构建复杂应用的基础：

Models（模型）：提供统一接口，用于与各种LLM（如OpenAI、Gemini、Hugging Face模型）和嵌入模型（Embedding Models，用于将文本转换为向量）进行交互。
Prompts（提示词）：提供了PromptTemplate等工具，帮助开发者以可复用和结构化的方式管理输入给模型的提示词，而不是简单地在代码中拼接字符串。
Indexes（索引）/Retrieval（检索）：这是实现RAG的核心。它包含文档加载器（Document Loaders，用于加载PDF、网页等）、文本分割器（Text Splitters，如RecursiveCharacterTextSplitter）和各种向量存储（Vector Stores，如Chroma、FAISS），用于高效存储和检索文本的向量表示。
Chains（链）：允许将多个组件（如提示词、模型、其他链）组合成一个端到端的任务工作流。例如，创建一个"检索-增强-生成"链，先检索文档，再将结果和问题一起交给模型。
Agents（智能体）：智能体使用LLM作为推理引擎，来决定采取哪些行动、调用哪些工具（如搜索引擎、计算器、内部API）来完成任务。它们可以实现动态的决策流程。

⚙️ RAG中的设计与应用：从经典到智能体式

RAG（检索增强生成）是LangChain最典型的应用场景之一。它通过从外部知识库检索相关信息来增强LLM的回答，有效解决了模型知识陈旧和"幻觉"的问题。在LangChain中，RAG的实现可以有不同的设计层次。

1. 经典RAG工作流设计

一个基础的RAG系统通常包含索引和检索与生成两个核心阶段。
第一阶段：索引（构建知识库）

加载文档：使用DocumentLoader从源（如PDF、网页）加载文档。
分割文本：使用TextSplitter（如RecursiveCharacterTextSplitter）将长文档切分成适合模型处理和检索的较小文本块（chunks）。
向量化与存储：使用Embeddings模型将每个文本块转换为向量，并将这些向量连同原始文本存入VectorStore（向量数据库）。
第二阶段：检索与生成
检索：将用户的输入问题同样向量化，然后在向量数据库中进行相似性搜索，找出最相关的文本块。
增强：将检索到的相关文本块作为上下文（context），与用户的原始问题组合成一个新的、内容更丰富的提示词。
生成：将这个增强后的提示词提交给LLM，由LLM基于提供的上下文生成最终答案。

下面是一个使用LangChain实现经典RAG的代码结构示例：

python

# 简化示例，展示核心逻辑
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 1. 加载并分割文档
loader = PyPDFLoader("document.pdf")
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
docs = text_splitter.split_documents(documents)

# 2. 创建向量存储
embeddings = OpenAIEmbeddings()
vectorstore = FAISS.from_documents(docs, embeddings)

# 3. 构建检索问答链
qa_chain = RetrievalQA.from_chain_type(
    llm=OpenAI(), 
    chain_type="stuff", # 将检索到的所有文档一次性塞入提示词
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3}) # 检索最相关的3个文档块
)

# 4. 提问
answer = qa_chain.run("文档中提到的主要结论是什么？")
print(answer)

2. 进阶设计：智能体式RAG

传统的RAG流程是固定的：每次提问都执行相同的检索->生成步骤。而智能体式RAG（Agentic RAG）则引入了动态决策能力。智能体可以根据问题的不同，自主决定如何行动，这使得系统更加灵活和强大。

智能体式RAG的核心特点是：

动态路由：智能体可以先判断问题类型。如果是简单的事实性问题，可能直接调用搜索引擎；如果是复杂分析，则检索向量数据库；如果需要实时信息，则调用API。
查询重写：如果初次检索到的文档质量不佳，智能体可以决定重写用户的原始问题，进行更有效的二次检索。
自我评估：在生成答案前，智能体可以对检索到的文档进行相关性评分（Grading），过滤掉不相关的内容，确保输入给LLM的信息是高质量的。
多工具协作：智能体不仅可以使用RAG工具，还可以同时调用计算器、代码解释器等其他工具，来处理多步骤的复杂任务。

一个智能体式RAG的工作流程可能如下：

路由器代理 接收用户问题，决定使用"向量搜索"、"网络搜索"还是"两者结合"。
如果选择"向量搜索"，检索代理 从向量库中获取文档。
评估代理 对检索到的文档进行评分。如果文档相关，传给生成代理；如果不相关，则触发查询重写代理，修改后的查询重新进入路由判断，形成反思和改进的循环。

💡 总结与设计要点

在LangChain中设计RAG应用时，可以根据需求选择不同的设计模式：

追求简单直接、对固定知识库进行问答：经典的RAG链（如RetrievalQA）是最高效的选择。它的设计要点在于优化文档分块策略（chunk_size, chunk_overlap）和检索的精准度（选择合适的嵌入模型、调整检索数量k值）。
需要处理复杂问题、融合多源信息、或对回答准确性有极高要求：智能体式RAG（可利用LangGraph实现更复杂的流程控制）是更优的架构。它的设计要点在于精心定义工具的描述、设计清晰的决策逻辑（路由规则）和有效的自我反思机制。

通过LangChain的模块化组件，你可以像搭积木一样，从简单的RAG系统开始，逐步引入智能体的动态决策能力，构建出能够适应各种复杂场景的下一代智能应用。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

01-FlagEmbedding 项目概述

AtomGit开源社区

06-FlagEmbedding 核心算法详解

AtomGit开源社区

FastGS: Training 3D Gaussian Splatting in 100 Seconds

3D 高斯溅射（3DGS）虽然比 NeRF 快很多，但训练依然要十几分钟，瓶颈在冗余高斯太多、密度控制不合理。现有加速方法要么靠 “预算限制”，要么剪枝太狠掉画质，多视角信息用得很粗糙。本篇文章提出FastGS：一套简单通用的 3DGS 加速框架，基于多视角一致性设计稠密化与剪枝策略，不需要预算机制。在多个数据集上实现3.29×~15.45× 加速，静态场景最快77 秒训完，还能无缝适配动态重建、