大模型RAG落地全流程详解:从动机到核心三阶段
本文阐述了RAG解决大模型数据局限性的动机,详细拆解了RAG的核心三阶段:索引、检索与生成,涵盖文档分割、向量化及逻辑链构建。同时介绍了利用LangSmith进行追踪和可观测性的重要性,为后续深入技术细节做铺垫。
我们详细介绍了 RAG 出现的背景以及动机,知道了为什么需要 RAG 以及最后 RAG 能帮我们完成哪些事情。在本节内容中我们将会就 RAG 开发的基本流程进行介绍。
前排提示,文末有大模型AGI-CSDN独家资料包哦!

1.核心动机:为什么需要 RAG?
首先,我们来做一个简单的回顾。
RAG(检索增强生成)的主要驱动力在于 LLM 预训练数据的局限性。尽管 LLM 的预训练规模宏大,但它们无法包含用户的私有数据或预训练之后的最新数据。
因此,我们可以将 LLM 视为一种新型操作系统的“内核(Kernel)”,而将这个内核连接到外部数据则是该系统发展的核心能力。同时,随着 LLM **上下文窗口(Context Window)**的不断扩大(从数千 token 增加到可容纳数百页信息的规模),通过 RAG 将外部信息直接提供给模型就变成了一件可行且高效的事情。
2.RAG 的三个基本阶段
从整体来看,RAG 这种通用范式通常由以下三个关键步骤组成:
- 索引(Indexing):对外部文档进行预处理和存储,以便后续根据查询进行检索。
- 检索(Retrieval):针对用户的问题,从存储的文档中寻找最相关的片段。
- 生成(Generation):将检索到的相关文档与用户问题一同输入 LLM,从而生成一个**有据可查(Grounded)**的答案。
进一步,对于 RAG 的整个生命周期来说,它包括
- 文档处理:加载外部文档(如博客文章)并将其**分割(Splitting)**成 1000 字符大小的块(Chunks)。
- 向量化存储:例如可以使用 OpenAI 的嵌入模型将分块转化为向量,并存储在本地的 Chroma 或 Milvus 向量数据库中。
- 逻辑链(Chain)构建:定义一个流程,该流程会自动运行检索器以获取相关文档,将它们填入预定义的提示词模板中(例如:“你是一个问答助手…使用以下检索到的内容来回答问题…”),最后交给 LLM 生成答案。

图 1. RAG 处理全流程
如图1所示便是 RAG 的整个处理流程,包括向量数据库构建到检索再到最终生成回答。
- 工具与可观测性
在整个 RAG 的流程构建中,为了确保系统的透明度,我们后续将使用 LangChain 开发的 LangSmith 组件来进行追踪(Tracing)和可观测性分析。通过 LangSmith,开发者可以清晰地看到检索器具体提取了哪些文档,以及最终传递给 LLM 的完整提示词内容,这对于调试和优化管道至关重要。
下面,我们将开始逐步来深入探讨索引、检索和生成中更高级的技术细节。
读者福利:倘若大家对大模型感兴趣,那么这套大模型学习资料一定对你有用。
针对0基础小白:
如果你是零基础小白,快速入门大模型是可行的。
大模型学习流程较短,学习内容全面,需要理论与实践结合
学习计划和方向能根据资料进行归纳总结
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓


👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

👉大模型视频和PDF合集👈
这里我们能提供零基础学习书籍和视频。作为最快捷也是最有效的方式之一,跟着老师的思路,由浅入深,从理论到实操,其实大模型并不难。

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
sobaiduweb~default-0-137261875.142%5Ev100%5Epc_search_result_base4&spm=1018.2226.3001.4187)👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)