代码开源 | 论文导读 | 首层可解释范式：轨道交通车辆故障诊断的新突破——可解释多视图融合胶囊网络的提出与应用

秋风暖暖

454人浏览 · 2026-03-16 10:51:02

秋风暖暖 · 2026-03-16 10:51:02 发布

近日，北京交通大学史红梅教授研究团队与香港理工大学和兰州理工大学团队在中科院计算机科学一区期刊*《Journal of Industrial Information Integration》（IF=11.6）上发表题为《Prior knowledge-embedded first-layer interpretable paradigm for rail transit vehicle human-computer collaboration fault monitoring》*的论文，提出一种基于可解释学习与多视图学习的故障诊断新范式——首层可解释范式。该研究通过嵌入信号处理先验知识，构建轻量化且可解释的胶囊网络PIFCapsule，并通过信号处理正则化损失优化整个网络结构，显著提升轨道交通车辆（高速列车、重载货车轮对、地铁列车）行走部轴箱（轴端）轴承的故障识别能力。

链接：https://authors.elsevier.com/c/1mbQL,tmku5BZZ
代码：https://github.com/liguge/PIFCapsule
引用：C. He, H. Shi, J.-X. Liao, B. Liu, Q. Liu, J. Li, Z. Yu, Prior knowledge-embedded first-layer interpretable paradigm for rail transit vehicle human–computer collaboration fault monitoring, Journal of Industrial Information Integration 51 (2026) 101068, https://doi.org/10.1016/j.jii.2026.101068.

01 论文导读

轨道交通车辆承受着大载荷、高速度和恶劣环境的影响，易导致部件故障。首层可解释范式（FLIP）将人类先验知识嵌入智能设备，是受定制化制造和具身智能指导的智能范式之一。它由首层可解释模块、骨干网络和损失度量组成。然而，现有研究存在依赖单一来源信息、缺乏可解释骨干网络、无法进行特征融合等问题，因此难以处理多激励、耦合信号。为填补这一空白，本文提出了一种基于FLIP的单阶段多视图胶囊融合网络（PIFCapsule）。首先，设计了一个具有信号处理先验的第一层可解释模块，以实现参数自动优化，并突出不同信号处理算法产生的多视图特征之间的互补性。其次，采用可解释胶囊网络作为骨干网络。为解决信息融合效率低下和不足的问题，本文提出了一种高效的注意力融合路由（AFR），与传统的基于胶囊的网络相比，该路由将参数减少了约5.72倍，复杂度降低了约2.93倍。针对训练过程中缺乏基于物理的约束这一问题，本文提出了噪声阈值振幅比（NTAR）作为正则化项，通过抑制学习到的噪声来增强微弱的周期性瞬态脉冲。通过三个真实的轨道交通车辆数据集验证了该方法的有效性和可靠性：在仅使用10个样本的情况下，PIFCapsule的准确率比最先进的方法高出6.77%。鉴于其轻量化特性，该网络在智能边缘设备上的部署具有巨大潜力。代码可在https://github.com/liguge/PIFCapsule获取。

轨道交通车辆轴承长期承受高负载、高速运转和复杂工况，故障频发且样本稀缺。传统数据驱动模型依赖大量标注数据，而单纯信号处理方法缺乏自适应能力。论文提出首层可解释性范式（FLIP），将人类先验知识嵌入智能诊断系统，实现人机协同的故障监测。其核心创新在于融合可解释多视图物理特征（小波变换卷积层、短时傅里叶变换频率卷积层、盲反卷积可微分层），并通过注意力融合路由机制实现高效特征交互。

02 主要创新点

核心贡献：将多种散见于可解释故障诊断的多种方法（如基于小波、STFT、盲解卷积等的先验嵌入技术）**系统性地总结并升华为一个统一的理论框架——首层可解释范式（First-Layer Interpretable Paradigm, FLIP）。该范式不仅清晰地刻画了以往研究的共同内核，更通过定义核心组件、设计原则和优化路径，为未来研究提供了可扩展的指导蓝图。
在人机协作的指导下，本文提出了一种单阶段基于物理的多视图融合胶囊网络（PIFCapsule），该网络包含三种由信号处理支持的第一层设计、一种注意力融合路由机制以及基于物理的正则化项。它提升了融合特征的可解释性。
将注意力路由融合机制引入胶囊网络（CapsNet）。该机制在显著减少原始动态路由参数数量的同时，还提高了泛化能力。通过此机制，PIFCapsule 充分考虑了基于物理的多视图信息之间的全局依赖关系，自适应地调整注意力权重，捕捉长程依赖，增加特征多样性，并最终实现高效的跨视图信息交互。
我们引入噪声阈值幅度比作为一种基于物理的正则化项。这种方法无需依赖故障前期数据，就能通过一个可微分的软阈值模块来抑制噪声。通过减弱噪声，它增强了信号的影响。作为正则化项，它约束了模型的优化过程，提高了鲁棒性，并提取出具有判别性的特征。
来自高速列车、重载货运列车和地铁列车走行部数据集的综合结果证明了该方法的优越性能。大量的消融实验验证了每个组件和结构的有效性。该方法在轨道交通车辆轴承健康监测领域展现出广阔的应用前景。

03 思路来源

本研究的方法论框架源于对工业智能诊断领域两大核心挑战——物理机理嵌入深度不足与模型本质可解释性薄弱——的系统性审视，其创新维度可概括为以下三个关键层面：首先，领域问题驱动促使研究团队直面传统故障诊断方法的固有局限。现有方法普遍局限于"信号预处理-黑箱建模"的两阶段范式，导致物理先验知识与数据驱动模型的训练过程存在显著割裂。其次，技术创新体现在信号处理经典理论与深度学习框架的深度融合。再者，方法学层面，本研究聚焦于通过设计注意力融合路由机制，在降低参数复杂度的同时实现跨视图特征的动态交互；引入噪声阈值幅度比等物理约束损失函数，将信号处理领域的量化指标直接转化为模型优化目标，确保决策过程与物理规律的内在一致性。该研究思路的核心价值在于构建了首层可解释范式，通过多视图物理知识融合、高效特征路由和物理约束优化的三重创新，为工业智能诊断的可解释性发展提供了具有理论与实践价值的研究范式。

04 主要图表结果

以框图形式展示了第一层可解释范式（FLIP）的总体架构。图表左侧代表“人类先验知识”（如信号处理理论），右侧是“智能设备”的计算模块。核心路径分为两条：

权重修改路径：通过领域知识（如小波理论）直接初始化第一层卷积核的权重，替代随机初始化（例如WaveletKernelNet中的做法）。

信号处理层路径：在模型前端添加可微分信号处理层（如STFT层），模拟传统信号处理操作，实现端到端训练。

图中标注了“First-layer interpretable modules”和“Backbones”，强调FLIP通过嵌入先验知识简化模型结构。

箭头方向体现知识流动：人类先验→参数约束→特征提取→决策输出。

以流程图形式描述了诊断系统的完整工作流程，共分三步：

1.数据准备阶段：从三种轨道交通车辆（高速列车、重载货车、地铁）采集振动信号，按健康状态分类，并以滑动窗口（长度2048）分割数据。

2.训练阶段：训练集输入PIFCapsule，联合优化多损失函数（边际损失、重构损失、BSQ损失、NTAR损失），保存最优权重。

3.测试阶段：加载训练好的模型，在测试集上评估性能（如准确率）。

由三子图构成，分别对应三个数据集的实验平台实物图：

Fig.6(a)：高速列车牵引电机轴承试验台（BJTU1），包含电气控制柜、传感器和测试轴承，模拟200–350 km/h工况。

Fig.6(b)：重载货运列车轮对轴承平台（BJTU2），配备轴向负载模拟装置和风扇（模拟横风），速度范围60–180 km/h。

Fig.6©：地铁列车转向架齿轮箱（BJTU3），比例1:2缩比模型，传感器部署还原真实测点。

05 实验解析

图表编号	实验目的
图7	验证模型在不同运行条件（速度/负载）下的鲁棒性
图8	分析样本量对性能的影响
图9	验证PIFCapsule相对CapsNet变体的效率优势
图10	通过可视化解释模型决策机制
图11	验证首层小波权重的物理一致性
图12	从频域视角验证多视图互补性
图13	验证BD视图提取周期性脉冲的有效性
图14	分析STFT视图的频带自适应能力
图15	揭示AFR机制的特征融合策略
表4	在三个数据集上全面对比10余种SOTA模型
表5	专注小样本下的融合效率对比
表6	量化各组件贡献度

通过对比PIFCapsule、Vanilla CapsNet和EfficientCapsule，揭示了AFR机制在轻量化和性能平衡上的突破。

如表所示，我们对这些模型与SOTA模型的性能进行了全面评估。这些模型可分为三类：①基础模型：ResNet、WDCNN、RCL和MSResNet。②第一层可解释模型：EWSNet、WaveletKernelNet、SincNet、FCC、MCNWFK、TFN、ClassBD、DFAWNet[81]、GTFENet[82]、wave_convNext[83]和RAVEL[84]。③在小样本数据下表现优异的模型：MCSwinT[85]、Convformer_NSE[86]、CLFormer[87]和Liconvformer[88]。

聚焦多源融合场景，对比PIFCapsule与CSST_Net（基于拼接融合）、MSIFT（基于交叉注意力）、HSE_ResNet（基于任务自适应池化）。实验在10样本下进行，评估数据集G和F的准确率、参数量及FLOPs。

06 总结和展望

PIFCapsule通过物理知识嵌入与多视图融合，为故障诊断提供了可解释、轻量化的解决方案。未来研究方向包括：

进一步轻量化模型结构；
探索跨设备迁移学习能力；
结合大语言模型（LLM）增强决策可解释性。该框架可扩展至其他工业设备的智能运维场景，推动具身智能在工业诊断中的落地应用。

07 论文访问（引用）

C. He, H. Shi, J.-X. Liao, B. Liu, Q. Liu, J. Li, Z. Yu, Prior knowledge-embedded first-layer interpretable paradigm for rail transit vehicle human–computer collaboration fault monitoring, Journal of Industrial Information Integration 51 (2026) 101068, doi：10.1016/j.jii.2026.101068.

@article{he2025pifcapsule,
  title={Prior knowledge-embedded first-layer interpretable paradigm for rail transit vehicle human-computer collaboration monitoring},
  author={He, Chao and Shi, Hongmei and Liao, Jing-Xiao and Liu, Qiuhai and Li, Jianbo and Yu, Zujun},
  journal={Journal of Industrial Information Integration},
  volume={51},
  pages={101068},
  year={2025},
  doi={10.1016/j.jii.2026.101068},
  publisher={Elsevier}
}

直达链接：https://doi.org/10.1016/j.jii.2026.101068.
https://authors.elsevier.com/c/1mbQL,tmku5BZZ

08 作者简介

何超（第一作者），北京交通大学在读博士研究生，研究方向为智能故障诊断与信号处理。https://liguge.github.io/

史红梅（通信作者），

北京交通大学机械与电子控制工程学院教授，博士生导师。长期从事轨道交通安全状态检测技术方面的科研，先后主持和参与国家级等各类科研项目50多项，发表论文50余篇，获发明专利10项，2013年、2018年两次获中国铁道学会科学技术奖一等奖，2022年获北京市科技二等奖。讲授《传感器原理及应用》本科课程，该课程获国家级一流课程，国家级一流专业测控技术与仪器专业负责人，指导全国研究生电子设计大赛、全国集成电路设计大赛等多项学科竞赛获奖，荣获北京市教学名师、宝钢优秀教师、北京市优秀教师、北京市优秀本科教学管理人员、全国优秀实践指导教师、北京交通大学五四奖章等荣誉称号。https://faculty.bjtu.edu.cn/5972/

团队背景：

机电学院轨道交通智能检测技术研究所是轨道交通安全2011协同创新中心、智慧高铁系统前沿科学中心和先进轨道交通自主运行全国重点实验室的核心团队，长期致力于轨道交通智能感知基础理论与关键技术研究，提出了轨道交通远程瞭望系统技术架构并研发了车载与路侧净空智能感知关键技术，联合单位交控科技、北醒光子、埃福瑞科技有限公司在关键感知传感器与装置研发、系统产业化应用方面充分发挥各自优势。该成果紧密结合高速铁路与城市轨道交通安全运行的净空监测需求，在基础理论、系统架构、关键传感、核心设备、系统应用层面完成了多项具有理论和实际应用价值的创新成果，为保障我国轨道交通运行安全并推动“智慧轨道交通”发展做出了重要贡献。

#多视图学习 #特征融合 #首层可解释范式 #轨道交通列车 #故障诊断 #牵引电机 #轴承 #重载货车 #地铁

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AI 行业的焦虑正在全球蔓延

AtomGit开源社区

# 基于HarmonyOS的五子棋对战游戏设计与实现

本文详细介绍了基于HarmonyOS的五子棋对战游戏开发过程，采用ArkTS语言实现，包含主菜单、难度选择、对战和规则说明等功能模块。重点阐述了AI对战算法设计、声明式UI实现和HarmonyOS应用架构，通过三种难度级别（随机落子、混合策略和完整评估算法）提升游戏可玩性。项目采用分层架构设计，实现了表现层、业务逻辑层和数据层的分离，为HarmonyOS游戏开发提供了实践参考。关键词：Harmon