摘要:本研究创新性地融合大语言模型、知识图谱技术及重排序方法,旨在以低成本、高质量实现民航维修历史方案检索与推荐方案生成,优化维修决策,提升维修效率与质量。研究利用大模型的分析推理能力,借助定制化知识图谱检索相关维修历史方案,再通过加权算法重排序查询结果,最后由本地大模型生成推荐排故方案。通过对大模型与知识图谱相关参数的协同优化,该方案可接近并达到专业排故工程师的能力水平,满足民航维修过程对高准确性和可溯源性的严格要求。

0 引言

随着航空技术的飞速发展,航空维修工作面临着前所未有的挑战,包括复杂系统的维护、高效故障排查、知识管理优化等。大语言模型(简称大模型)与知识图谱作为人工智能领域的重要技术成果,以其强大的知识表示与推理能力,为航空维修的智能化转型提供了新的思路和解决方案。

当前大模型已经具备强大的长文本处理能力[1],无须将文本切割成零散片段,能够直接处理完整的维修方案记录。本文提出的方法是利用知识图谱的上下文关联关系和混合检索的重排序技术, 从海量的民航维修历史知识库中筛选出最贴切相关的完整维修记录。利用大模型对这些记录进行梳理和整合,生成最终的维修方案。在此过程中,知识图谱不仅用于知识推理,还能有效表达维修文档之间的关联关系,从而显著提升搜索的准确性和效率。

1 维修知识特征与管理要求

1.1 民航业的特点

民航维修知识体系具有鲜明的特点。首先,航空维修领域存在大量的专业术语,且经常出现中英文混写、缩写的现象。其次,经过信息化改造,大部分的系统已经实现了表格化管理,但类似排故方案等信息通常还是以长字符串的形式存储于结构化的表格中。此外,维修手册采用XML 格式,并且严格按照ATA 章节[2] 结构编排,便于信息的检索与管理。在维修领域,事件的关系有限,主要包括串件、拆装、检查等,同时维修过程会关联工具、物料号和手册号这些信息。

1.2 知识检索的重要性

飞机系统的复杂性体现在其众多的系统和相互交联的关系,飞机的故障产生往往不是独立的,通常需要多个系统的协同排查并进行溯源分析。故障之间的关联性错综复杂,因此有效的知识检索系统显得尤为重要,它能够帮助工程师快速定位故障源头,整合各系统的历史排故知识和经验,从而提高故障诊断的准确性和效率。

1.3 民航维修准确性要求

民航业对准确性的要求极为严格,因为任何错误都可能对飞行安全产生重大影响。所以,民航业的各类手册、排故方法需要不断更新优化,以适应技术进步和运营环境的变化。此外,一些故障的诊断和处理方法具有很强的时效性,因此,民航业的知识库必须与最新的管理要求保持同步,及时更新和整合各类知识资源。

2 相关研究

2.1 传统方式

1)模型训练

通过重新训练模型进行知识更新会有很多局限性。这种方法不仅需要大量的高质量标注数据集,同时训练过程会造成潜在的知识破坏和认知退化问题,从而导致训练时间和投入成本不可控。这种耗时耗力的训练方式不仅会增加模型的复杂性和黑箱特性,而且难以及时对知识进行更新和修改,结果也无法进行解释与溯源,因此无法满足民航业对高准确性和及时性的要求。

2)RAG方式[3]

使用大模型加向量数据库的传统RAG方式,虽然在一定程度上提升了信息检索和生成的准确性,但在实际使用中仍存在诸多不足。首先是文本块的切分,不同的文本因为格式、排版等问题会有不同,传统的切割方式会有不准确的问题。其次,向量数据库因为无法体现文本或知识之间的关联关系,只能进行简单的相似性查找,对于复杂且缠绕较深的问题无法做到准确的检索。此外,文本转向量过程中,如果文本过长,文本中的关键信息也会被淹没造成核心标志信息遗失,检索效果会打折扣。

2.2 基于大模型、知识图谱和重排序的融合方法

经过大量的尝试和探索发现大模型、知识图谱和重新排序的方法在信息检索中优势显著,该方法可以更好地捕捉和利用信息片段之间的复杂关系,提供更丰富、更具语境的信息检索结果。

知识图谱的多跳推理能力,支持系统沿关系链进行复杂深入的逻辑分析。该融合检索方式不仅提高了查询效率,还降低了开发成本。本地部署的开源大模型可对检索到的历史方案进行总结分析,生成的建议方案可以达到普通排故工程师水平,经参数优化后可接近专家级别。同时,方案是基于完整历史方案生成的,溯源问题可直观解决。

3 研究思路

3.1 系统架构设计

1)系统框架

整体架构如图1 所示。该系统结合了大模型的认知和生成能力、商用大模型的通用知识、民航维修专业文本向量模型及专业维修知识库,系统基于Graph-RAG[4] 理念进行构建,采用混合检索策略和重排序技术,显著提升了检索的质量、准确性和效率。

2)大模型应用定位

大模型在系统中主要承担两部分工作。首先,用于知识的抽取。通过设计固定的提示词模板,系统能够高效地抽取所需的内容,包括实体、简述、关键信息以及文本之间的关系等。对于复合词,系统还需进一步抽取其关联的部件和简称,以实现更精细的颗粒度。其次,大模型在系统中是协调各个板块的工作,而非直接提供知识。这种定位使得大模型能够有效地整合不同模块的功能,确保系统的高效运行。

3)提示词

在提示词工程中,小样本学习[5] 加角色模拟相结合的方式可以极大地提高

结果的准确率。通过构建包含角色背景、任务目标及示例问答对的“三要素”方式,使模型在有限样本中学习角色特有的任务模式和逻辑,提示词模板示例见表1。

图1 系统架构图

3.2 维修专业词汇库

在民航维修领域,存在大量的专有词汇、术语和口语,这些词汇的准确识别和理解对于技术文档的翻译和知识融合至关重要。若未进行系统的汇总和记录,将影响系统对相关技术文档的识别能力,词汇样例见表2。

1)词汇来源

目前,所有的词汇来源于民航专业网络、各类制造商维修手册、维修记录抽取以及纸质词典的扫描等,利用爬虫、NLP 工具、OCR 识别和大模型等技术可以高效地获取、清洗和整理相关专业词汇。

2)词汇作用

构建一个标准的词汇知识库尤为必要。维修过程中同一实体可能有不同的表达方式,这种多样性不仅增加了知识融合的难度,还可能导致信息理解的歧义。另外,建立一个包含民航维修领域专有词汇、俗语、行业语及其中英文对照的词汇知识库,还可以为专业翻译提供坚实的基础。

3)搭建方式

维修专业词库采用直接查询和间接查询两种查询方式。直接查询支持通过中英文、缩写及简述进行搜索,能够快速定位到目标词汇及其相关信息。间接查询则通过将词汇转化为向量,实现基于语义相似性的关联查询。当用户检索一个词时,系统不仅能够快速呈现其相关的中英文、俗语、行业语等信息,还能通过向量检索技术找到语义相关的词汇,从而提高搜索的准确性和精准度,有效减少歧义。

3.3 维修方案知识库

1)维修方案记录

维修历史记录通常以长字符串的方式详尽记录了工程师针对飞机故障所涉及的所有工作,该记录方式给信息的有效检索和利用带来了挑战。具体而言,长字符串包含了飞机出现的故障现象、排故方案、处置结论和排故思路。这一过程可能涉及多个方案的提出与验证,直至最终问题的解决。故障描述和方案中蕴含了丰富的信息,包括涉及的部件和系统,使用的工具和器材,排故的方法和步骤等。我们将一个完整的记录整理成如下 json 格式:

{

   "故障描述":"…",

" 排故方案":{" 方案1":“…”,"

方案2":“…”,…},

" 处置结论":“…”,

}

2)信息抽取

故障描述、解决方案和处置结论这些文字之间不能简单地进行链接,因为在后续的检索中会面临如何高效、精准检索难题。我们利用大模型按照排故过程中涉及的操作内容和可能存在的关联关系对文本进行信息抽取,最后再通过人工抽查的方式完成数据的审核,抽取要素样例见表5。

在构建知识图谱时对故障描述中的关键信息进行拆分,提取出问题描述(如“左外襟翼防磨带损伤”)、涉及的实体名词(如[ 襟翼]、[ 防磨带])、故障现象(如[ 防磨带损伤])等,并将这些信息作为独立节点存储。同样,在解决方案部分,我们对方案步骤、所需工具、预期结果等细节进行拆分和节点化处理。通过这种方式,故障与解决方案之间的复杂关系得以充分展现,如图2 所示。同时对于比较复杂的复合词汇([ 左外襟翼防磨带])可以进一步通过大语言模型进行切分([ 左外襟翼]- 关联->[ 防磨带]),增加知识链接的丰富度。

3)知识图谱的搭建

因为数据规模较大,本文使用了Neo4j 的neo4j-admin database import 命令批量导入数据,从而大幅提升了导入效率。搭建形式如图 3 所示。

为了更好地管理和检索图谱中各类节点,我们按照预定义关系和属性特点对节点进行划分,分为实体标签、文本标签、系统标签、故障类型标签等。例如:

a. 实体标签中包含零部件名称、简称、专业名词等信息;

b. 文本标签包含关键信息、简述、现象、故障描述、方案、注意事项等。

图谱的搭建过程中,我们对入库的节点进行了向量转换,所有节点之间通

过向量的相似性进行虚拟链接,实现了信息的全局关联。

3.4 信息检索

1)阈值与权重

a. 在知识图谱中,各个节点因所属标签和类别的差异,可根据实际业务需求在系统中设置不同的阈值和权重。其中,阈值用于图谱检索过程中向量相似度的判定,权重则用于后续路径分值的计算。具体设置见表3。

b. 知识图谱中的实体节点可以利用TF-IDF 概念,以故障记录为单位对每个实体进行统计和分析,通过生成的逆文档频率数值间接对图谱中出现的实体进行重要程度区分。逆文档频率的计算公式如下:

其中,M 表示维修记录文档总数,N(t)表示包含t 词汇的文档数量。计算结果见表4。

2)检索方法

依据信息抽取过程中设置的要素内容(见表5)设置提示词模板,对输入的查询问题按照要素内容进行抽取。涉及词汇的内容通过搜索维修专业词汇库返回相关联的词汇,并转化成向量。

为了提升检索的效率和准确性,我们采用了组合查询方式。

a. 利用Neo4j 的APOC 库中的apoc.cypher.parallel2 函数,通过向量并行搜索找到图谱中的相关节点,然后利用关联关系找到历史记录。

b. 采用多跳搜索方式,通过部件、实体和现象等节点关联到历史记录。

检索结果保留路径信息,记录各个搜索记录在检索传递过程中涉及的节点和关联关系,并整理成如下 json 格式:

{

" 路径":[

{" 节点1":" 左发",  " 相似度":

0.95," 关系":" 简称"},

{" 节点2":" 发动机","

相似度":0.96," 关系":" 检查"},

],

" 维修记录":“…”

}

图2 维修记录知识点展示

图3 子图检索示意图

3)重排序问题

如图3 所示,依据3.1 节中设置的提示词模板对输入的查询问题按照要素内容进行抽取。抽取出来的要素通过向量在知识图谱里搜索,激活图谱中的路径;相似度虚线的深浅代表激活程度,颜色越深表示关系越强。

知识图谱中的实体和关系构成复杂的网络结构,当用户查询一个问题时,系统可能会通过不同的路径找到同一个目标节点,所以需要合并这些路径的信息,避免在排序时重复计算或混淆。每一条路径分数是由与故障直接链接的节点和关系决定的。关系的权重参考表3,若关系与检索要素中抽取出的关系相匹配,则相应地增大该关系在表3 中所赋予的权重,同时节点的分数还通过IDF值进行计算。通过计算逆文档频率,可以有效降低如“电线”“传感器”等常见术语所对应路径的重要性,从而避免这些高频词汇对检索结果的干扰。

如图3 中的路径①②③,都可以到达同一个故障信息。路径①③都是由“拆装”关系链接到故障的,本文选取路径最高分数来处理这种情况。路径①②③经过处理被精简至两条。本文中提出的解决方案是导向同一故障的所有不同路径的分数进行累加,在示例中是两条路径的分数加和代表该故障最终的得分。最终对所有关联到的结果进行分数排序,公式化为:

其中,

表示故障相关节点(图3 中的实体1)的权重。

表示故障相关节点的逆文档频率。

表示增益系数,通常为1.0,当故障相关节点之间的关系与检索关系匹配时,该系数可用于放大匹配程度,从而提升路径的分值。

表示检索节点与路径末端节点的相似程度。

4 结果与应用

4.1 评价方法设计

该系统是为了提升维修效率与质量,所以我们通过问卷方式收集用户对信息检索系统的直接反馈。在问卷中,我们选取具有代表性的典型问题,涵盖发动机、活门、传感器等关键故障类型,确保问题的广泛性和实用性。检索生成的方案,邀请多个相关领域工程师从准确性、完整性、有用性、清晰度4 个维度进行1 ~ 5 分制评分,每个维度都有明确的评价标准,准确性侧重技术内容正确性,完整性关注关键点覆盖程度,有用性评估实际维修指导价值,清晰度考量表达逻辑与可读性,这样的多维度评价能够全面衡量答案质量。同时,每份答案末尾设置“是否推荐该答案用于实际维修?”的问题,进一步获取对答案实际应用价值的直接判断。通过量化用户满意度评价,查询质量评估等定性指标评价来评估检索性能[6]。问卷设计示例见表6。

4.2 实验结果

评价指标的计算如式(3)~式(6)所示

其中,A 表示准确性平均分,N 表示题目总数,ai表示第题的准确性评分。

其中,Q 表示优质答案率,N 表示题目总数,优质答案qi 为单题满足任意

3 个维度≥ 4 分且无维度≤ 2 分。

其中,R 表示专家推荐率,N 表示题目总数,推荐答案ri 为获得3 位及以

上专家推荐“是”的答案。

其中,C 表示评分一致率,N 表示题目总数,对每道题目,评分一致答案

ci 为专家评分极差≤ 1。

实验结果表明,基于大语言模型与知识图谱的融合架构在知识检索任务中展现出显著优势:准确性平均分达3.81(阈值≥ 3.8),优质答案率与专家推荐率分别达到75% 与62.5%,评分一致率达87.5%,均超过预设基准,平台检索性能评价见表7。

然而,各指标仍存在不足,总结如下。

1)维修方案使用前有特定的前置条件

在飞机维修领域,部分生成的答案虽具备优质性,但采用存在前置条件,如执行某项工作前,需要拆下某些零件或者断开某电源等。相关工程师要严谨评估执行前的安全问题,参与制定维修方案。结合具体状况,不宜直接推荐投入使用,需要扩充相关OEM 制造商手册知识。

2)大模型问题分解的局限性

在投入使用一段时间后,我们观察到员工提出的问题基本分为两类。第一类是描述性问题,这类问题可以直接进入知识库进行搜索解答;第二类是推理性问题,对于这些复杂问题,准确地将其分解为知识图谱能够有效处理的子问题是关键一步。然而,目前所使用的大模型不具备深度思考能力,在这一过程中会出现分解不准确的情况。

3)知识图谱的覆盖范围

另外,尽管知识图谱包含了大量结构化的知识,但仍存在一定的知识盲区。当问题涉及知识图谱中未收录或未准确描述的知识时,知识检索平台生成的答案会受到限制。

5 结语

本文中的检索平台聚焦于民航维修领域,通过融合大模型推理分析生成能力、知识图谱和文本关联关系以及重排序方法,以低成本、高质量的方式实现历史维修方案的精准检索与推荐方案的高效生成,提升维修工作的效率与质量。

在研究过程中也发现了一些可以优化的环节。下一步,计划引入具备深度思考能力的模型,如DeepSeek,将其应用于推理性问题的解决过程中,这种方式能够显著提升推理性问题分解的准确性,将复杂问题高效地拆解为多个子问题。通过逐一攻克这些子问题,进而实现对复杂问题的整体解决。

另外,将会把OEM 厂商等标准手册加入知识库。当用户输入故障问题时,不仅会生成排故经验方案,还会生成手册标准方案和相关执行要求等。

同时,将持续拓展和更新知识图谱,填补知识盲区,进一步丰富知识图谱的检索范围。通过这些改进,进一步更好地满足民航维修过程中对高准确性和可溯源性的严格要求。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐