KG与LLM:大模型时代的智能规划
推理方式
LLM可以利用自然语言指令,利用海量常识知识,生成类人的推理过程。
1.思维链(Chain-of-Thought, CoT)
- 核心思想:引导大模型显式输出中间推理步骤,而不是直接给出答案
- 最简单实现:在提示词中加入 "让我们一步步思考"
2.思维树(Tree-of-Thought, ToT)(NeurIPS 2023)
- 核心思想:将单一的推理链扩展为树状结构,在每个步骤生成多个候选思路,通过评估和剪枝选择最优路径
- 四大关键环节:
- 思维拆解:将问题分解为多个中间推理步骤
- 候选生成:在每个步骤生成多个可能的思维
- 状态评估:评估每个思维的可行性和前景
- 搜索剪枝:保留有希望的分支,剪枝无希望的分支
https://arxiv.org/abs/2305.10601
https://arxiv.org/abs/2305.10601
3.思维图(Graph-of-Thought, GoT)
- 核心思想:将推理结构从树进一步扩展为图,支持思维的合并、循环和跳转
https://arxiv.org/abs/2308.09687
https://arxiv.org/abs/2308.09687
4.Plan-and-Solve 方法(ACL 2023)
- 核心思想:将任务分为两个独立阶段:
- 规划阶段:一次性生成完整的任务计划,包括所有步骤和依赖关系
- 执行阶段:按照计划逐步执行,每步验证结果
https://arxiv.org/abs/2305.04091
https://arxiv.org/abs/2305.04091
5.ReAct方法(ICLR 2023)
模型交替进行推理与行动,但是思维是直接反射式的。
https://arxiv.org/abs/2210.03629
https://arxiv.org/abs/2210.03629
6.REASONING ON GRAPHS: FAITHFUL AND INTER PRETABLE LARGE LANGUAGE MODEL REASONING(ICLR 2024)
现有的基于知识图谱的 LLM 推理方法仅将知识图谱视为事实知识库,而忽略了其结构信息对于推理的重要性。
我们提出了一种名为“图上推理”(RoG)的新方法,该方法协同 LLMs 与 KGs,以实现忠实且可解释的推理。具体而言,我们提出了一个“规划-检索-推理”框架:
- 规划: 先让模型根据知识图谱的结构生成一个“关系路径”作为计划。
- 检索与推理: 按照这个计划去知识图谱里找证据,然后基于这些证据进行推理。
[2310.01061] 图上的推理:忠实且可解释的大语言模型推理
https://arxiv.org/abs/2310.01061
7.StructGPT(EMNLP 2023)
开发了一种迭代式“阅读-推理”框架来解决基于结构化数据的问答任务。构建了专用的接口来从结构化数据中收集相关证据(即“阅读”),并让大语言模型专注于基于这些收集到的信息进行推理任务(即“推理”)。用统一框架搞定多种结构化数据,据我们所知,这是首个用单一范式让 LLM 推理多种结构化数据(表格、知识库、数据库)的研究。
https://arxiv.org/abs/2305.09645
https://arxiv.org/abs/2305.09645
8.RAP(EMNLP 2023)
通过规划进行推理(RAP)。RAP 将大语言模型重新利用,使其既充当“世界模型”又充当“推理智能体”,并结合了一种基于蒙特卡洛树搜索(MCTS)的原则性规划算法。
RAP 为大语言模型配备了一个世界模型,并利用原理化规划(具体为蒙特卡洛树搜索,MCTS)进行推理,从而在高效探索后生成高回报的推理轨迹(如图 1 所示)。值得注意的是,我们通过适配相应的提示词,复用大语言模型本身来获取这个世界模型。
https://arxiv.org/abs/2305.14992
https://arxiv.org/abs/2305.14992
9.LATS(ICML 2024)
Language Agent Tree Search(LATS)
【方法】:LATS借鉴了模型驱动强化学习中的蒙特卡洛树搜索方法,将LLM用作agent,价值函数和优化器。
节点和提示词必须能够有效地存储和检索外部反馈,而搜索算法则需要将这些信息转化为用于价值评估的有效启发式规则。许多大语言模型任务允许回退到早期步骤,我们将预训练的大语言模型重新利用为具备由大语言模型驱动的价值函数和自我反思能力的智能体,以实现更智能的探索。
https://openreview.net/forum?id=njwv9BsGHF
https://openreview.net/forum?id=njwv9BsGHF
10.MindMap(ACL 2024)
大语言模型能够理解知识图谱输入,并结合隐式知识(模型内部训练所得)和外部知识进行推断。此外,我们的方法还能激发大语言模型生成“思维导图”
1.从问题中抽取实体。2.找到知识图谱的实体,查找两个实体之间的最短路径。3.把多条路径组合成完整推理链。4.查询一个实体直接相连的所有知识点。5.把结构化语言变为自然语言。6.计算词向量相似度,用于实体匹配。7.用于生成决策树图片时自动换行。8.输入:患者问题 + 知识图谱证据输出 3 部分:1:诊断答案。2:推理路径(思维图)。3:决策树(可视化推理)
https://aclanthology.org/2024.acl-long.558/
https://aclanthology.org/2024.acl-long.558/
RAG
1.GraphRAG
GraphRAG 诞生了,它将知识图谱引入 RAG 流程,把知识表示成“节点 + 边”的形式,把不同文档中的实体及其关系连接起来。在查询时,不仅会查询出相似度最高的文档,还会基于知识图谱查询出与其关联的文档,因此大模型就能够拥有更加完整的上下文来回答问题。
先进行文本切分,实体与关系提取,构建图,社区检测与报告生成;再进行检索,局部检索,全局检索
2.Self-RAG(ICLR 2024,前1%)
Self-RAG的诞生就是为了解决这个核心矛盾:让模型自己判断什么时候需要查资料,什么时候不需要。实现微调一个模型,学会在有输入的情况下,输出任务输出与反思令牌去反思自身的生成过程,反思令牌分为检索令牌与批评令牌(检索需求与生成质量)。1.首先输入提示和先前的生成内容,self-rag会去判断检索到的段落对后续生成是否有帮助。2如果需要,则会检索到多个段落,按相关性输出。3.生成批评令牌评判质量输出。
https://arxiv.org/abs/2310.11511
https://arxiv.org/abs/2310.11511
3.Retrieve-Plan-Generation(EMNLP 2024)
提出了检索-计划-生成(RPG)框架。
RPG 迭代两个阶段:规划阶段和回答阶段。在规划阶段,模型生成代表后续文本主题的标记;在回答阶段,模型根据这些主题,从检索文档中筛选出高度相关的段落,并以此为基础生成针对性答案。多任务提示调优方法,为规划和回答生成分别训练一组可学习的提示令牌,两组提示令牌共享相同的软提示。在训练阶段,每条数据会同时用于规划和回答任务的训练。
https://aclanthology.org/2024.emnlp-main.270/
https://aclanthology.org/2024.emnlp-main.270/
4.DeepSieve(Findings of EACL 2026)
通过 “LLM 作为知识路由器” 实现信息筛选。将复杂查询拆解为结构化子查询,并递归地将每个子查询路由到最合适的知识源,通过多阶段信息筛选过程过滤无关信息。
DeepSieve 通过分解 - 路由 - 融合 - 反思的模块化流程,解决异构数据源下的多跳推理问题:
- 分解(Decomposition):把原问题拆解为两个子问题:
What is the [birthplace] of Eric Hort?What country is the [birthplace] of?
- 路由(Routing):根据子问题的类型,自动分发到最合适的数据源:
- 子问题 1 → 人员数据库,得到答案
Montabello - 子问题 2 → 通用数据库,查询
Montabello的所属国家,得到USA
- 子问题 1 → 人员数据库,得到答案
- 融合与观察(Fusion & Observation):整合两个子问题的答案,得出最终结果
United States,并验证其合理性。 - 反思(Reflection):对推理结果进行校验,如果出现无效结果(比如错误地推断为 New York),会重新调整路由或查询,直到得到正确答案。
https://aclanthology.org/2026.findings-eacl.160/
https://aclanthology.org/2026.findings-eacl.160/
5.DAVIS(Findings of EMNLP 2025)
目的:去做一个agent。让其处理更精细的科学任务。DAVIS 融入了结构化与时序记忆,可支持基于模型的规划决策。此外,DAVIS 构建了智能体式多轮检索系统,通过多轮对话式检索,主动发现并填补知识缺口。
流程:1.World Model(世界模型):生成规划
-
- 世界模型以知识图谱为基础,接收当前环境的观测(如 “厨房里有炉灶、金属锅、水槽”),生成下一步的行动轨迹。
-
Actor(执行器):分解与执行
- 智能体的 Actor 模块将规划拆解为可执行的子步骤(如:拿起锅、移到水槽、激活水槽、再拿起锅),并将动作发送到环境中执行。
- 动作执行后,会收到环境的反馈(新的观测
O_{t+1}和奖励r_t)。
-
Critic(评估器):发现偏差
- Critic 模块对比世界模型的预期结果和环境的实际反馈,检测偏差。
- 例如,在图中,智能体发现 “水槽坏了”,无法按预期给锅装水,任务失败。
-
Reflection(反思):更新世界模型并重新规划
- 智能体根据失败信息进行反思,更新世界模型的知识,识别问题根源(水槽故障),并提出新的子任务(“找工具修理水槽,或寻找其他装水方式”)。
- 更新后的世界模型会重新生成规划,进入下一轮迭代。
https://aclanthology.org/2025.findings-emnlp.895/
https://aclanthology.org/2025.findings-emnlp.895/
Agent
1. Verification-Aware Planning for Multi-Agent Systems (EACL 2026)
VERIMAP 规划器可对任务进行拆解、建模子任务依赖关系,并将规划器预设的交付标准。
1. 顶层流程:两大核心模块
Verification‑aware Planner(核验感知规划器)
接收输入任务,完成任务拆解、子任务依赖建模、输出规范定义、核验函数(VFs)生成,输出 DAG 形式的任务规划方案。
Subtask Coordinator(子任务协调器)
调度各子任务执行、校验结果,当核验失败时触发Replanning(重规划),将异常信息回传给规划器,迭代更新任务方案。
https://aclanthology.org/2026.eacl-long.353/
https://aclanthology.org/2026.eacl-long.353/
2.PlanGEN(EMNLP 2025)
PlanGEN一种模型无关、易扩展的智能体框架,包含三大核心组件:约束智能体、核验智能体、选择智能体。提出约束引导式迭代核验,用于提升Best‑of‑N、思维树(Tree‑of‑Thought)、REBASE等推理时算法的性能。在 PlanGEN 框架中,选择智能体可根据实例复杂度动态优化算法选型,使模型更好地适配复杂规划问题。
包含三类专用智能体:约束智能体、核验智能体、选择智能体。
- 约束智能体:提取实例专属约束条件(如预算、概念、规则等);
- 核验智能体:结合约束条件评估规划质量,输出奖励分数;
- 选择智能体:基于改进的上置信界(UCB)算法(Han 等人,2024),针对不同复杂度的实例动态选择最优推理算法。
框架内集成三类主流推理算法:N 选最优(Best of N)、思维树(Tree‑of‑Thought, ToT)、奖励均衡搜索(REBASE)。
eg:该示例任务:为 Alexander、Elizabeth、Walter 三人,在周一 9:00–17:00 内安排一场 30 分钟会议,找出所有人都空闲的最早时段。
框架分为约束提取→初始规划→迭代核验与算法自适应选择→最终规划生成→下游执行全链路。
1. 任务输入层(左上)
- Task Description and Problem Statement:输入完整任务描述,包含参会人员、各自忙碌时段、会议时长、时间范围等硬性约束。
2. 三大核心智能体并行工作
(1)通用大模型 Any LLM
直接生成初始规划方案(Initial Generated Plan),但本例初始规划存在可用性判断错误,规划结果不符合约束。
(2)约束智能体 Constraint Agent
提取实例专属约束条件:
分析参会人员名单
校验会议时长合规性
验证时间范围有效性
确认每个人的可用 / 不可用时间
输出Generated Constraints(提取后的约束规则),为后续核验提供标准。
(3)选择智能体 Selection Agent(核心自适应模块)
LLM‑based Selection:根据任务复杂度初步筛选算法,本例判定:BoN 适配度 0.4、REBASE 适配度 0.1、ToT 适配度 0.9;
Modified UCB‑based Selection:基于改进 UCB 算法动态更新分数,迭代后分数更新为 BoN4.0、REBASE1.0、ToT9.0;
输出Selected Algorithm(选定算法),用于生成Updated Plan(更新规划);
支持三类子框架:PlanGEN (BoN)、PlanGEN (ToT)、PlanGEN (RS),循环迭代直至找到最优方案。
(4)核验智能体 Verifier Agent
结合约束规则逐项校验:人员可用性、共同空闲时间、解的有效性、格式合规性等;
输出Verify and Reward(核验结果 + 奖励分数):本例因可用性判断错误,获得低分-50;
分数低于阈值(Score < Th)则触发Iterative Update(迭代更新),反馈给选择智能体重新选算法、生成新规划;
分数达标(Score > Th)则输出Final Generated Plan(最终优化规划)。
3. 下游执行层(右侧)
最优规划方案输入通用大模型,完成Plan Execution(规划执行),输出Final Answer(最终答案),形成完整推理流水线。
https://aclanthology.org/2025.emnlp-main.1042/
https://aclanthology.org/2025.emnlp-main.1042/
3.LRPLAN(Findings of EMNLP 2025)
在训练阶段,基于 LLM 与 LRM 的智能体协同学习,抽象出目标领域内的关键模式、启发式规则与先验知识;在测试阶段,两类智能体复用习得的模式与知识,完成新规划实例的求解。
自然语言描述的规划问题:部分约束为显性约束(直接在输入中给出),另一部分为隐性约束,往往需要依托常识推理完成。
首先基于某领域的训练样本生成推理轨迹;随后部署多个智能体,通过分析推理轨迹归纳领域内通用模式、启发式规则,并总结常见错误规律。习得的领域知识用于简化新问题的规划流程,最终规划链路仅包含两个核心模块:初始规划生成器与规划优化器。其中,推理轨迹生成(训练阶段)、初始规划优化(测试阶段)由 LRM 完成,其余智能体均由 LLM 承担。、
eg:
查询指令:4 人小组,2022 年 3 月 10–12 日,从拉斯维加斯前往圣玛利亚的 3 日旅行规划;预算 3700 美元,偏好美式与地中海菜系。
基线模型缺陷分析
1. AutoBuild(GPT‑4o)
- 生成问题:住宿选择
Beautiful Manhattan 1br... - 约束违规:不满足最低 3 晚住宿规则,显性约束校验失败。
2. MAD(o3‑mini,多智能体辩论框架)
- 生成问题:两日午餐均选择
Indian By Nature - 约束违规:餐厅重复,不满足餐厅多样性的隐性常识约束。
四、LRPLAN(GPT‑4o + o3‑mini)架构与工作逻辑
框架包含 3 个核心智能体,分工实现约束提取、模式识别、自我修正:
- 模式识别器(Pattern Recognizer):归纳领域通用模式,如「最低住宿晚数的最优平价住宿选择」「保守型用餐规划策略」;
- 规则提取器(Rule Extractor):提取显性 + 隐性约束规则,如住宿筛选规则、用餐规划规则;
- 自我修正器(Self Corrector):迭代调整用餐方案,保障餐厅多样性,修正预算与菜系匹配问题。
最终输出正确规划(Correct Plan):
- 住宿:
Cozy apartment,满足最低晚数约束; - 餐饮:多品类餐厅轮换,兼顾美式 / 地中海偏好,实现多样性;
- 完整覆盖 3 日行程,全部约束均合规。
https://aclanthology.org/2025.findings-emnlp.440/
https://aclanthology.org/2025.findings-emnlp.440/
4. SYMPHONY(NeurIPS 2025 )
异构大语言模型协同多智能体规划框架(SYMPHONY2),该新型多智能体规划框架集成了一组异构大语言模型智能体。通过利用不同智能体间差异化的推理模式,SYMPHONY2 能够提升推演采样的多样性,实现更高效的搜索探索。
异构智能体池,由预训练来源、推理风格各不相同的大语言模型构成。框架不再依赖单个智能体,而是在每个搜索节点分配不同智能体生成候选动作,为搜索树引入结构性多样性。该多样性能够提高互补推理路径的生成概率,弱化模型固有偏差,提升复杂多跳任务的性能。实验结果表明,扩大模型多样性可使每个节点生成更多差异化分支,稳定提升任务准确率。
除模型异构性外,SYMPHONY 还集成多项互补模块进一步优化规划性能:基于 ** 上置信界(UCB)** 的调度策略,根据历史表现动态分配智能体,优化多智能体协同效率;熵调制置信度打分机制(EMCS),结合智能体层面的不确定性校准价值估计,实现更稳定的评估;最后,全局智能体池记忆共享机制,使各智能体通过自然语言形式复盘过往失败经验,经验在智能体池内共享并融入后续提示词。以上模块共同实现高效、自适应、鲁棒的搜索行为。
以异构智能体池(Heterogeneous Agent Pool)为核心,在 MCTS 搜索树的每个节点调用不同大模型智能体生成动作分支;通过多智能体协同调度、不确定性评估、全局记忆共享
https://arxiv.org/abs/2601.22623
https://arxiv.org/abs/2601.22623
5.EvoMem
EvoMem—— 一种基于双演化记忆机制的多智能体规划框架。该框架包含三类智能体(约束提取器、验证器、执行器)与两大记忆模块:
- 约束记忆(CMem):存储任务专属规则与约束,在不同查询间动态更新演化,但在单次查询内保持固定;
- 查询反馈记忆(QMem):在单次查询内部迭代演化,累积各轮反馈信息以优化求解方案。
三类专用智能体
- 约束提取器(Constraint Extractor)接收原始任务描述,提取硬性约束条件,初始化约束记忆(CMem)。
- 执行器(Actor)基于 CMem 的固定约束 + QMem 的历史迭代反馈,生成具体规划方案。
- 验证器(Verifier)校验执行器输出,给出分数(Score)与错误项(Errors),反馈至 QMem。
2. 两大记忆模块(双演化核心)
- 约束记忆 CMem(绿色):跨查询演化、单次查询内固定存储任务全局约束,示例包含:总行程时长、固定日期事件、单城市停留时长、航班限制。作用:为执行器、验证器提供稳定不变的约束基准,全程不被修改。
- 查询反馈记忆 QMem(红色):单次查询内动态演化记录每轮迭代的:输出方案、验证分数、错误信息。作用:累积失败经验,实现迭代纠错、方案持续优化。
二、完整推理流程
- 输入任务描述(规划 14 天欧洲三城旅行,含城市停留天数、会面时间、直飞要求等);
- 约束提取器解析任务,生成 CMem,锁定全部硬性约束;
- 执行器结合 CMem + 历史 QMem 反馈,输出规划方案;
- 验证器对方案打分、定位错误,输出验证结果;
- 若方案达标(分数≥阈值\(\boldsymbol{\ge \epsilon}\)),直接输出最终规划;
- 若不达标,将本轮方案、分数、错误存入 QMem,进入下一轮迭代;
- 迭代循环直至方案合格或达到最大轮次限制;
- 单次任务结束后,CMem、QMem 全部重置。
https://arxiv.org/abs/2511.01912
https://arxiv.org/abs/2511.01912
6.CausalPlan
提出CausalPlan两阶段框架,将显式结构因果推理融入大语言模型规划流程。
核心为结构因果动作(SCA)模型:该模型从智能体运行轨迹中学习因果图,刻画历史动作、当前环境状态对未来决策的影响机制。基于该因果结构,框架为大语言模型生成的候选动作分配因果分数、对候选方案进行权重重分配;必要时可切换为具备因果依据的备选动作,以此引导动作选择。通过将因果知识直接嵌入决策循环,CausalPlan 可将规划行为约束为干预一致性行为,且无需对大语言模型本身进行微调。
第一阶段:依托成熟的结构因果模型发现技术,迭代优化生成参数与结构参数,训练 SCA 模型。训练完成后,SCA 模型输出因果动作矩阵\(\boldsymbol{M}\),以因果分数的形式编码双方历史动作、当前观测对所有潜在下一动作的因果影响。
第二阶段:将因果知识融入规划流程。每一步规划中,利用我方与合作方智能体的当前状态、历史动作查询矩阵\(\boldsymbol{M}\),通过两种方式规避因果无效动作:
- 因果感知动作规划:利用矩阵输出的因果分数,对大语言模型原始动作概率进行加权调整,重采样后选择既有效、又与合作方角色互补的下一动作;
- 若无有效动作,启用因果备选动作机制,选取因果概率最高的动作。
eg:
一、阶段 1:因果动作结构学习(Causal Action Structure Learning)
1. 输入数据源
数据集 \(\boldsymbol{B}\):由行为策略 \(\boldsymbol{\pi_\beta}\) 采集的多智能体交互轨迹,包含双方历史状态 \(\{s_t^1,s_t^2\}\)、历史动作 \(\{a_t^1,a_t^2\}\)。
2. SCA 模型训练
- 优化两类参数:生成参数 \(\boldsymbol{\delta}\)、结构参数 \(\boldsymbol{\eta}\),训练结构因果动作(SCA)模型;
- 输出因果动作矩阵 \(\boldsymbol{\mathcal{M}}\):量化当前状态、历史动作对未来候选动作的因果影响分数;
- 红色框为因果分数计算示例:将各状态、前序动作的因果贡献求和,得到每个候选动作的因果得分
- 拾取洋葱:\(0.3+0.3+0.0+0.5=\boldsymbol{1.1}\)
- 洋葱入锅:\(0.8+0.3+0.6+0.5=\boldsymbol{2.2}\)
3. 输出产物
训练完成的因果动作矩阵 \(\boldsymbol{\mathcal{M}}\),为第二阶段规划提供因果依据。
二、阶段 2:基于因果知识的智能体规划(Agent Planning with Causal Knowledge)
该阶段实现 LLM 智能体的因果约束动作选择,包含两条分支逻辑,以厨房场景为例:智能体 1 手持洋葱、智能体 2 手持洋葱、锅为空。
- LLM 输出候选动作:生成候选动作集合
- 分支 1:候选动作非空
,绿色对勾)→ 因果感知动作规划
- 对 LLM 原始动作概率
,利用因果分数做加权重采样:
LLM原始概率×γ+因果分数×(1−γ)
- 示例:
- 拾取洋葱:
- 洋葱入锅:
- 拾取洋葱:
- 输出最终有效、符合时序逻辑的动作。
- 对 LLM 原始动作概率
- 分支 2:候选动作空集(
,红色叉号)→ 因果备选动作
- 直接从因果矩阵
中选取因果分数最高的动作,兜底避免无动作输出。
- 直接从因果矩阵
https://arxiv.org/abs/2508.13721
https://arxiv.org/abs/2508.13721
7.KnowAgent: Knowledge-Augmented Planning for LLM-Based Agent
RAG与KG结合
1. Knowledge Graph-Guided Retrieval Augmented Generation(NAACL 2025)(C)
利用知识图谱(KG)刻画文本片段间的事实级关联,提升检索结果的多样性与连贯性。
具体而言,KG2RAG 首先通过语义检索获取种子文本片段;随后采用知识图谱引导的片段扩展与基于知识图谱的片段组织流程,将相关且重要的知识整理为结构清晰的段落输出。
本文提出知识图谱引导式检索增强生成框架(KG2RAG)。具体而言,首先在文档离线处理阶段完成文本分块与知识图谱‑文本块关联,建立文本片段与专属知识图谱的映射关系,捕捉片段间的事实级关联。KG2RAG 加入基于知识图谱的上下文组织后处理模块:一方面,该模块作为信息过滤器,保留子图中相关性最高的信息,提升检索片段的信息密度;另一方面,以知识图谱为骨架,对文本片段进行结构化整理,生成逻辑连贯的段落。
- 流程:用户查询 → 关联知识图谱 (KG) → 抽取查询相关的知识子图 (Subgraph) → 以结构化关联知识输入 LLM 生成回答。
- 优势:通过实体‑关系‑实体三元组建模文本间内在逻辑,实现关联式检索、结构化上下文,解决传统 RAG 碎片化问题。
https://aclanthology.org/2025.naacl-long.449/
https://aclanthology.org/2025.naacl-long.449/
2.FRAG(Findings of ACL 2025)
FRAG 仅依靠用户查询预估推理路径的跳数范围,将查询划分为简单查询与复杂查询;针对不同查询复杂度,采用定制化流水线,实现高效、精准的推理路径检索,进而优化最终推理过程。该框架通过查询文本(而非知识图谱本身)推断推理路径的结构信息,并采用自适应检索策略,在保证灵活性的同时提升检索质量。
KG‑RAG 框架可分为两类:模块化 KG‑RAG与耦合式 KG‑RAG。
- 模块化方法:将检索过程与大语言模型解耦,侧重隔离性、灵活性与可扩展性;用户查询上下文 → 检索模块(包含搜索 Search、排序 Ranking) → 从知识图谱 KGs 中检索推理路径 → 将推理路径作为增强信息输入大语言模型 LLMs → 生成最终回答。
- 耦合式方法:将知识图谱与模型深度绑定,可提升生成质量,但会增加复杂度,牺牲灵活性与可扩展性。用户查询上下文 → 先将正确推理信息、知识图谱特征通过微调 Fine‑tuning注入 LLM;同时查询输入检索模块,从 KGs 检索推理路径;融合微调后的 LLM + 检索得到的推理路径 → 生成最终回答
FRAG 无需引入知识图谱信息,可根据查询上下文的复杂度动态适配检索流程,提升推理准确率。
如图 2 所示,本文分析知识图谱中查询q对应的正确推理路径P的信息来源:路径P包含语义信息(实体、关系)与结构信息(跳数)。
语义信息主要来源于知识图谱,难以提前预判利用;结构信息同时关联知识图谱与查询本身:通常查询越复杂,推理路径跳数越多,推理任务难度越高。
因此,在可接受的误差范围内,可仅依靠查询上下文预测推理路径跳数,将预测跳数作为核心依据,优化无特定知识图谱适配的通用检索流程。
推理感知模块(Reasoning‑aware)与灵活检索模块(Flexible‑retrieval)。
-
推理感知模块:用于预测推理路径的结构信息,包含三方面设计:
- 简化预测任务:预估粗粒度跳数范围,基于跳数阈值将查询推理复杂度划分为简单 / 复杂两类,降低预测误差影响;
- 跨域分类器构建:收集多领域知识图谱与查询数据,提取查询上下文的语义、统计特征,训练具备泛化能力的跨域分类器;
- 优化策略:利用大语言模型的反馈,针对性提升分类器在特定知识图谱上的性能。
-
灵活检索模块:将 KG‑RAG 检索流程重构为预处理‑检索‑后处理流水线,针对简单、复杂推理任务分别定制流水线组件,组件均基于传统算法搭建,保证框架通用性。
- 简单推理任务(短推理路径):采用广度优先搜索(BFS)+ 排序作为核心检索策略,实现高效精准检索;
- 复杂推理任务(长推理路径):采用最短路径检索 + 排序,最小化计算开销、降低噪声,提升检索有效性。
https://aclanthology.org/2025.findings-acl.321/
https://aclanthology.org/2025.findings-acl.321/
3.Respecting Temporal-Causal Consistency: Entity-Event Knowledge Graph for Retrieval-Augmented Generation(EACL 2026)
实体‑事件检索增强生成框架(E²RAG),一种双图结构框架:将实体子图与事件子图分开构建,通过二分映射实现关联,以此保留细粒度推理所需的时序与因果信息。
预处理(Preprocessing):构建实体‑事件知识图谱
输入叙事文本(示例为赫敏遭遇巨怪的原文片段);
实体与关系抽取:提取实体(赫敏・格兰杰、罗恩等);
事件与关系抽取:提取核心事件(巨怪事件 Troll Incident);
构建事件‑事件知识图谱(Event‑Event KG):
红色节点:实体节点(Hermione Granger、Ron),保留不同语境下的实体提及,不合并去重;
蓝色节点:事件节点(Troll Incident);
节点间连边:实体‑事件、事件‑事件的关联关系,完整保留时序、因果与人物动态变化信息。
2. 查询处理(Query processing)
解析用户问题,抽取问题中涉及的实体、事件,作为检索关键词。
3. 图谱检索(Search)
基于提取的实体、事件,在实体‑事件知识图谱中检索,获取:
与事件绑定的实体、关联关系
对应实体 / 事件的上下文描述、原文文本片段
4. 生成输出
将检索到的结构化上下文输入大语言模型,生成最终精准回答。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)