IndexRAG:单次检索,多跳称王

一、多跳QA的困境
多跳问答(Multi-hop QA)要求模型跨越多篇文档进行推理,比如回答"电影Aylwin的导演出生在哪里"需要先找到导演是谁,再找到他的出生地。传统RAG方法要么采用固定分块检索(Naive RAG),无法捕捉文档间的隐性关联;要么依赖图结构(如HippoRAG、GraphRAG),在推理时进行实体抽取和图遍历,导致在线推理成本高昂、延迟增加;要么采用迭代检索(如IRCoT),通过多轮检索-生成循环逐步逼近答案,但推理时间随步数线性增长。

图1:不同RAG范式的对比。IndexRAG将跨文档推理从在线阶段转移到离线索引阶段
如表1所示,现有方法难以同时满足"单次检索、跨文档推理、单次LLM调用、无需训练"这四个需求。
| 方法 | 单次检索 | 跨文档推理 | 单次LLM调用 | 无需训练 |
|---|---|---|---|---|
| Naive RAG | ✓ | × | ✓ | ✓ |
| HippoRAG | × | ✓ | × | ✓ |
| IRCoT | × | ✓ | × | ✓ |
| IndexRAG | ✓ | ✓ | ✓ | ✓ |
表1:不同RAG方法的能力对比
二、离线生成桥接事实
IndexRAG的核心洞察是:跨文档的推理模式与具体查询无关,完全可以在索引阶段预计算。基于此,作者提出了两阶段流水线:
阶段1(AKU提取):使用LLM将每篇文档分解为原子知识单元(AKUs,以问答对形式组织),同时提取文档中的实体。
阶段2(桥接事实生成):识别在多篇文档中出现的"桥接实体"(bridge entities),针对每个桥接实体,收集相关文档中的片段,提示LLM生成桥接事实(Bridging Facts)——这些事实显式编码跨文档推理链,例如将"Aylwin由Henry Edwards导演"和"Henry Edwards出生于Weston-super-Mare"合并为"Aylwin的导演出生于Weston-super-Mare"。

图2:IndexRAG架构。(a)离线索引阶段生成AKUs和桥接事实;(b)在线推理阶段通过平衡上下文选择机制控制桥接事实比例
在线推理时,查询通过标准的向量相似度检索,从统一的向量库(包含原始AKUs和生成的桥接事实)中召回Top-K结果。为避免短小的桥接事实过度挤占长文本AKUs的上下文窗口,IndexRAG采用平衡上下文选择机制(Balanced Context Selection),限制桥接事实的最大数量(通常设为3),确保原始文档信息不被淹没。
三、性能与效率兼得
在HotpotQA、2WikiMultiHopQA和MuSiQue三个多跳QA基准测试上,IndexRAG展现出优异的性能-效率权衡:
性能方面:仅用单次LLM调用的情况下,IndexRAG相比Naive RAG平均F1提升4.6分(表4),在最难的MuSiQue数据集上提升尤为显著(34.4 vs 29.9)。当与IRCoT结合后,IndexRAG平均F1达到55.0,超越所有基线包括需要多轮调用的HippoRAG。

表4:多跳QA性能对比(%)。灰色背景表示需要多轮LLM调用的方法
效率方面:IndexRAG的在线推理仅需单次检索+单次LLM调用,检索延迟仅0.30秒(与Naive RAG持平),远低于FastGraphRAG(2.55秒)和HippoRAG(3.13秒)。所有跨文档推理成本都被转移到离线索引阶段,实现了"一次构建,多次高效查询"的范式转移。
总之,IndexRAG通过索引时推理(Index-time Reasoning)的创新,在不增加在线推理开销的前提下,将跨文档推理能力内化到检索单元中,为构建高效的多跳QA系统提供了新的思路。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)