关于做 RAG 知识库,被新人问最多的 8 个问题,我一次答完
·
带人做知识库问答 Agent,同样的问题被问了无数遍。整理成 Q&A,新人入门、老人查漏都能用。
Q1:模型选最强的,召回是不是就准了? 不是。RAG 的瓶颈九成在召回,不在模型。文档没切好、向量不对路,再强的模型也是"巧妇难为无米之炊"。先调召回。
Q2:文档直接整篇丢进去行不行? 不行。整篇一个 chunk,语义被稀释,检索匹配不上。按小节切、控制在两三百字、相邻留点重叠。
Q3:它老说"未找到相关内容",明明文档里有? 多半是切片或向量的问题。中文文档别用偏英文的 embedding;切太粗也会召不回。
Q4:怎么防止它瞎编? 在设定里写死:"没检索到就说没有,不许编。" 再让它回答带上出处,方便你核对。
Q5:文档改了,它还答旧的? 索引没重建。改完要重新触发索引,并且——测一条刚改的内容确认生效,这步最容易漏。
Q6:要不要加 rerank(重排)? 召回 Top10 后用重排取前 3,能救回"召回到了但排太后被截断"的情况,准确率有提升,值得加。
Q7:用什么搭省事? 我用的是一个零代码搭智能体的平台,配知识库,切片、向量、重排都能在界面里调,不用自己搭检索链路。当然参数还得你自己试。
Q8:怎么知道改得对不对? 攒一批测试问题,每次改完跑一遍对比。没有量化,"变好了"全是错觉。
这 8 个基本覆盖了入门的坑。我那套测试问题集放评论区了。你们做 RAG 还踩过哪些没列到的?
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)