大模型RAG落地全流程详解：从动机到核心三阶段

bug樱樱

361人浏览 · 2026-03-17 21:24:39

bug樱樱 · 2026-03-17 21:24:39 发布

本文阐述了RAG解决大模型数据局限性的动机，详细拆解了RAG的核心三阶段：索引、检索与生成，涵盖文档分割、向量化及逻辑链构建。同时介绍了利用LangSmith进行追踪和可观测性的重要性，为后续深入技术细节做铺垫。

我们详细介绍了 RAG 出现的背景以及动机，知道了为什么需要 RAG 以及最后 RAG 能帮我们完成哪些事情。在本节内容中我们将会就 RAG 开发的基本流程进行介绍。

前排提示，文末有大模型AGI-CSDN独家资料包哦！

1.核心动机：为什么需要 RAG？

首先，我们来做一个简单的回顾。

RAG（检索增强生成）的主要驱动力在于 LLM 预训练数据的局限性。尽管 LLM 的预训练规模宏大，但它们无法包含用户的私有数据或预训练之后的最新数据。

因此，我们可以将 LLM 视为一种新型操作系统的“内核（Kernel）”，而将这个内核连接到外部数据则是该系统发展的核心能力。同时，随着 LLM **上下文窗口（Context Window）**的不断扩大（从数千 token 增加到可容纳数百页信息的规模），通过 RAG 将外部信息直接提供给模型就变成了一件可行且高效的事情。

2.RAG 的三个基本阶段

从整体来看，RAG 这种通用范式通常由以下三个关键步骤组成：

索引（Indexing）：对外部文档进行预处理和存储，以便后续根据查询进行检索。
检索（Retrieval）：针对用户的问题，从存储的文档中寻找最相关的片段。
生成（Generation）：将检索到的相关文档与用户问题一同输入 LLM，从而生成一个**有据可查（Grounded）**的答案。

进一步，对于 RAG 的整个生命周期来说，它包括

文档处理：加载外部文档（如博客文章）并将其**分割（Splitting）**成 1000 字符大小的块（Chunks）。
向量化存储：例如可以使用 OpenAI 的嵌入模型将分块转化为向量，并存储在本地的 Chroma 或 Milvus 向量数据库中。
逻辑链（Chain）构建：定义一个流程，该流程会自动运行检索器以获取相关文档，将它们填入预定义的提示词模板中（例如：“你是一个问答助手…使用以下检索到的内容来回答问题…”），最后交给 LLM 生成答案。

图 1. RAG 处理全流程

如图1所示便是 RAG 的整个处理流程，包括向量数据库构建到检索再到最终生成回答。

工具与可观测性

在整个 RAG 的流程构建中，为了确保系统的透明度，我们后续将使用 LangChain 开发的 LangSmith 组件来进行追踪（Tracing）和可观测性分析。通过 LangSmith，开发者可以清晰地看到检索器具体提取了哪些文档，以及最终传递给 LLM 的完整提示词内容，这对于调试和优化管道至关重要。

下面，我们将开始逐步来深入探讨索引、检索和生成中更高级的技术细节。

读者福利：倘若大家对大模型感兴趣，那么这套大模型学习资料一定对你有用。

针对0基础小白：

如果你是零基础小白，快速入门大模型是可行的。
大模型学习流程较短，学习内容全面，需要理论与实践结合
学习计划和方向能根据资料进行归纳总结

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

请添加图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

这里我们能提供零基础学习书籍和视频。作为最快捷也是最有效的方式之一，跟着老师的思路，由浅入深，从理论到实操，其实大模型并不难。

在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
sobaiduweb~default-0-137261875.142%5Ev100%5Epc_search_result_base4&spm=1018.2226.3001.4187)👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【Qt教程29】Qt5和Qt6版本对比

原创作者：郑同学的笔记原文链接：https://zhengjunxue.blog.csdn.net/article/details/159691226Qt6 与之前的版本相比，无论是在底层架构还是上层 API 上，都带来了根本性的变革。为了帮你快速了解，这里从整体和内部两个层面，梳理了 Qt6 各版本间的核心差异。