AI RAG 系统完整工作流程

catoop

663人浏览 · 2026-04-28 17:01:34

catoop · 2026-04-28 17:01:34 发布

RAG 系统完整工作流程

RAG（Retrieval-Augmented Generation，检索增强生成）系统从用户发出消息到返回应答，中间经历多个关键步骤。下面通过几张图表来详细说明整个流程。

一、端到端总览流程图

二、详细检索流程（核心环节）

三、时序图：各组件协作过程

四、离线索引构建流程（前置准备）

RAG 系统在服务用户之前，还需要一个离线知识库构建的过程：

五、各步骤关键说明

步骤	说明	关键技术/组件
① Query 预处理	意图识别、纠错、Query 改写、多轮对话历史截取	LLM / 规则引擎 / NLU
② 向量检索	将 Query 转为向量，在向量数据库中做 ANN 近似最近邻搜索	Milvus, Pinecone, FAISS, Weaviate
③ 混合检索	结合向量检索 + 关键词检索（BM25），提升召回率	ElasticSearch, RRF 融合
④ Rerank 精排	用交叉编码器对召回文档做精细化排序	Cohere Rerank, BGE-Reranker, ColBERT
⑤ Prompt 组装	将检索到的上下文拼接到 Prompt 模板中，控制 Token 长度	Prompt Template, Token 管理
⑥ LLM 生成	大模型基于上下文生成答案，减少幻觉	GPT-4, Claude, 通义千问, DeepSeek
⑦ 后处理	引用溯源、事实校验、答案格式化、安全过滤	规则引擎 / LLM 审核链

六、整体架构思维导图

总结

一句话概括：用户提问 → 改写优化 Query → 从知识库检索相关文档（向量 + 关键词混合检索 → Rerank 精排）→ 拼装 Prompt（上下文 + 问题） → LLM 基于检索内容生成回答 → 后处理返回用户。

核心价值在于：LLM 的回答不是凭空生成的，而是基于真实检索到的知识库内容，从而大幅降低幻觉、提高准确性，并可以追溯引用来源。

（END）

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

cover

海外动态代理行业彻底换代，AI 数据时代新标准已到来

AtomGit开源社区

cover

2026年论文写作AI哪个好用？7款工具实测对比，轻松拿捏

AtomGit开源社区

cover

2026年SEO+GEO优化指南：搜索排名机制解析与实用工具推荐

AtomGit开源社区

所有评论(0)

查看更多评论

catoop

已为社区贡献10条内容