关于做 RAG 知识库，被新人问最多的 8 个问题，我一次答完

鹿枝儿 · 2026-06-10 12:45:43 发布

带人做知识库问答 Agent，同样的问题被问了无数遍。整理成 Q&A，新人入门、老人查漏都能用。

Q1：模型选最强的，召回是不是就准了？ 不是。RAG 的瓶颈九成在召回，不在模型。文档没切好、向量不对路，再强的模型也是"巧妇难为无米之炊"。先调召回。

Q2：文档直接整篇丢进去行不行？ 不行。整篇一个 chunk，语义被稀释，检索匹配不上。按小节切、控制在两三百字、相邻留点重叠。

Q3：它老说"未找到相关内容"，明明文档里有？ 多半是切片或向量的问题。中文文档别用偏英文的 embedding；切太粗也会召不回。

Q4：怎么防止它瞎编？ 在设定里写死："没检索到就说没有，不许编。" 再让它回答带上出处，方便你核对。

Q5：文档改了，它还答旧的？ 索引没重建。改完要重新触发索引，并且——测一条刚改的内容确认生效，这步最容易漏。

Q6：要不要加 rerank（重排）？ 召回 Top10 后用重排取前 3，能救回"召回到了但排太后被截断"的情况，准确率有提升，值得加。

Q7：用什么搭省事？ 我用的是一个零代码搭智能体的平台，配知识库，切片、向量、重排都能在界面里调，不用自己搭检索链路。当然参数还得你自己试。

Q8：怎么知道改得对不对？ 攒一批测试问题，每次改完跑一遍对比。没有量化，"变好了"全是错觉。

这 8 个基本覆盖了入门的坑。我那套测试问题集放评论区了。你们做 RAG 还踩过哪些没列到的？

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

WalkingLab 组织入驻 AtomGit，释放高校智能体开源科研成果

海外动态代理行业彻底换代，AI 数据时代新标准已到来

全球首个！京东全栈开源JoyAI-VL-Interaction，让大模型从“一问一答”走向“边看边说”

查看更多评论

已为社区贡献6条内容

温馨提示：您尚未绑定手机号