论文题目:OAIFAN: A Noise-Robust Discriminative Feature Unification Framework for Cross-Speed Fault Transfer Diagnosis

发表期刊:IEEE Transactions on Instrumentation and Measurement(IEEE TIM,仪器仪表领域国际顶级期刊)

DOI:10.1109/TIM.2025.3577843

开源数据:https://github.com/hitwzc/Bearing-datasets

作者:黄宇涵,胡小溪,王欢,何艺鸣

作者单位:哈尔滨工业大学、清华大学、华中科技大学

  • 研究背景与动机

1.1 跨转速故障诊断的重要性与现实挑战

在复杂工业系统中,旋转机械长期运行于多工况、强扰动和高负载环境,其健康状态直接关系到生产连续性、设备可靠性与运维成本。作为传动系统中最常见、最关键的基础部件之一,滚动轴承一旦发生局部损伤,若不能及时识别,将可能引发整机振动恶化、停机检修甚至重大安全事故。因此,面向真实工业环境开展高精度、高鲁棒性的智能故障诊断研究,是设备健康管理领域的重要研究方向。

近年来,深度学习凭借强大的自动特征提取能力,在轴承故障诊断任务中取得了显著进展。然而,绝大多数现有模型都隐含依赖训练数据与测试数据独立同分布的假设,而这一前提在实际工业场景中往往难以成立。尤其是在跨转速运行条件下,设备故障信号会随着转速变化而表现出显著不同的频谱结构、冲击间隔和统计特征,从而导致源域与目标域之间产生明显的分布偏移。换言之,在某一固定转速下训练得到的诊断模型,通常难以直接迁移到另一未知转速下稳定工作。对于实际工程系统而言,设备运行转速受工艺需求、负载扰动、机械摩擦和外部环境共同影响,实时保持完全恒定几乎不可能,因此,跨转速故障迁移诊断具有极强的现实意义和工程价值。

从迁移学习角度看,现有跨工况故障诊断方法主要分为域适应(Domain Adaptation, DA)与域泛化(Domain Generalization, DG)两类。域适应方法通常需要在训练阶段提前获得目标域无标签数据,但在真实工业场景中,未来未知工况往往无法预先采集,这使得DA方法的工程适用性受到限制。相比之下,DG方法无需访问目标域数据即可学习具有迁移能力的知识表示,更符合现场部署需求。进一步地,由于单一源域数据难以充分覆盖目标域中潜在的分布变化,多源域泛化(Multisource Domain Generalization, MDG)逐渐成为跨转速故障诊断的重要研究方向。通过整合多个已知转速下的源域信息,模型有机会学习到更稳健、更通用的故障表征,从而提升对未知转速工况的适应能力。

1.2 现有方法的局限性:两大核心瓶颈

尽管多源域泛化为跨转速故障诊断提供了新的解决思路,但现有方法在实际应用中仍存在两个长期未被有效解决的关键问题。

  • 多源域之间由转速差异带来的固有分布偏移往往被忽略。 

当前大多数方法的处理思路是:将来自不同转速条件下的多源信号直接输入深度网络,希望模型自动学习“域不变特征”。然而,这种做法存在一个根本缺陷——当不同源域的转速差异较大时,同一故障类型在频域中的特征位置会随着转速而发生显著漂移,从而削弱不同域之间的共享知识。也就是说,网络所面对的并不是“带有轻微差异的同类样本”,而是“在特征表达层面已明显错位的多组数据”。在这种情况下,即使采用复杂的对抗学习、注意力机制或特征对齐策略,模型也难以从源域中充分挖掘真正可迁移的公共规律。因此,如何在特征提取之前就主动降低不同转速源域之间的表达差异,是跨转速诊断必须优先解决的基础问题。

  • 工业噪声环境下的深度去噪普遍缺乏物理约束。 

工业现场采集到的信号不可避免地叠加背景噪声、瞬态冲击、机械振动传递干扰以及采集链路误差。已有不少工作尝试通过深度学习开展端到端去噪,但其核心驱动力通常仍然是分类损失,即模型保留“有助于提高分类准确率”的成分,而不是依据“哪些成分本质上属于噪声、哪些成分本质上属于故障响应”来做物理意义上的区分。这种分类驱动去噪虽然在部分数据集上可能获得较好精度,但从机制上看存在明显风险:一方面,模型可能错误保留那些与标签偶然相关、但本质上属于噪声的模式;另一方面,也可能因为弱故障特征对当前分类目标贡献不够显著,而将其误删。特别是在跨转速任务中,如果噪声模式在不同工况之间具有不稳定性,这种“非物理”的去噪机制将进一步加剧模型泛化性能下降。

正是在上述双重挑战驱动下,本文提出了OAIFAN(Order Analysis-Informed Fault-Aware Network),将旋转机械中的阶次分析理论、物理约束去噪思想与深度学习中的特征建模和分布对齐策略有机融合,形成一套面向跨转速故障迁移诊断的抗噪判别特征统一框架,从而系统解决“跨转速分布差异大”和“工业噪声干扰强”这两个核心难题。

  • 方法介绍:OAIFAN抗噪判别特征统一框架

2.1 整体架构设计思想

本文提出的OAIFAN整体框架如图1所示。该框架主要由四个部分组成:信号预处理模块、基于信号处理理论的特征提取模块、特征对齐模块以及诊断决策模块。整体设计逻辑遵循“统一表征—精准去噪—关键增强—判别对齐”的渐进式处理范式:首先通过等角重采样将不同转速下的原始时域信号映射到统一角域中,从源头减小多源域之间的分布差异;随后结合变分模态分解(VMD)对信号进行结构化分解,为后续噪声抑制和特征筛选提供更清晰的输入;在此基础上,通过动态重加权阈值去噪模块(DRTDM)和自适应特征频带增强模块(AFBEM)完成物理约束下的噪声抑制与关键故障频带增强;最后通过联合分布对齐(JDA)损失强化多源域之间类条件一致性,并输出最终故障类别诊断结果。该框架不是简单叠加多个已有模块,而是围绕跨转速故障诊断中的“特征表达不统一”和“噪声鲁棒性不足”两个核心问题展开协同设计,因此具备鲜明的问题导向与工程针对性。

图1 OAIFAN整体框架图

2.2 信号预处理:等角重采样与VMD协同统一故障表达

为解决不同转速源域之间故障特征表达不一致的问题,OAIFAN首先引入了等角重采样(equal-angle resampling)策略。与传统方法直接在时域或频域上学习域不变特征不同,本文从旋转机械的物理本质出发,将参考轴转频定义为一阶阶次,并利用机械系统内部相对固定的结构比例关系,将不同转速下的信号映射到统一的角域空间中。在该表示下,虽然不同工况下的实际转频不同,但故障相关激励在角域中的阶次表达具有稳定一致性。图2展示了时域采样与等角重采样之间的基本区别,图3进一步给出了不同转速下内圈故障信号在重采样前后的包络谱/阶次谱对比结果。可以清晰观察到:在原始时域包络谱中,同一故障在不同转速条件下对应的特征频率位置明显不同;而经过等角重采样后,不同转速信号在角域中的故障阶次峰值则高度一致。这说明OAIFAN并非依赖后续深度网络“被动适应”分布偏移,而是在输入层面主动完成跨转速故障表达统一,从根源上增强不同源域之间的共享知识。

图2 时域采样与等角重采样示意图

在完成角域映射后,OAIFAN进一步采用变分模态分解(VMD)将统一后的信号分解为多个本征模态函数(IMFs)。VMD的作用不仅是将复杂信号按频带结构进行显式拆解,更重要的是让后续网络不必直接面对混杂在原始信号中的多种频率成分,而能够在更加清晰、结构化的模态空间中执行去噪与特征增强。这样一来,后续模块能够更加直接地识别故障信息所在频带,并抑制噪声主导的无效模态。


图3 内圈故障信号在重采样前后的包络谱/阶次谱对比图

2.3 动态重加权阈值去噪模块(DRTDM)

OAIFAN的第一个核心创新模块是动态重加权阈值去噪模块(Dynamic Reweighted Thresholding Denoising Module, DRTDM),其结构如图4所示。该模块旨在解决现有深度学习去噪方法过度依赖分类监督、难以依据噪声本质属性进行精确区分的问题。本文注意到,在经过模态分解之后,噪声与故障信号在物理特性上具有显著差异:噪声通常表现为低幅值、能量相对均匀地分布在整个模态结构中,而故障信号的能量则更多集中于幅值较大的分解系数区域。这意味着,若能够依据系数分布动态学习保留/抑制策略,则可以更可靠地实现“保故障、抑噪声”。

图4 DRTDM结构图

基于这一思想,DRTDM通过结合全局池化、一维卷积和全连接映射,同时建模模态内局部相关性与模态间全局相关性,并将传统阈值去噪中的“系数是否保留”问题转化为一个可学习的二元决策过程,而不再依赖固定阈值规则。进一步考虑到硬阈值操作带来的不可导性,本文引入Gumbel-softmax重参数化技术,使动态阈值选择过程能够在端到端训练框架中稳定优化。此外,针对轴承故障冲击往往仅出现在局部关键时间段而非均匀分布于全序列这一事实,DRTDM还设计了多尺度位置注意力机制,对去噪后的局部片段进行重加权,从而使模型将更多表征能力分配给真正与故障相关的时序区域。

为从物理层面说明该设计的必要性,论文基于六自由度轴承动力学模型构建了多种典型故障仿真信号,其结果如图5所示。可以看出,不同故障类型及不同严重程度对应的冲击响应并不是在整个时间轴上均匀展开,而是集中在有限局部区间内。由此可见,若模型能够在去噪同时聚焦这些关键时段,将更有利于提取具有判别性的故障特征。

图5 四类典型轴承故障仿真信号图

2.4 自适应特征频带增强模块(AFBEM)

在DRTDM完成精细去噪后,OAIFAN进一步引入自适应特征频带增强模块(Adaptive Feature Band Enhancement Module, AFBEM),其结构如图6所示。该模块的设计目标在于:从VMD分解得到的多个模态/频带中,自适应识别并提升那些真正富含故障信息的子带,同时抑制冗余模态和噪声主导频带。为了使这一过程具备明确的物理依据,本文选取了两个具有典型故障敏感性的统计指标——归一化能量比(NER)和峭度(Kurtosis)。其中,NER反映某一频带在整体信号中的能量占比,能够衡量故障能量是否集中于特定子带;峭度则对冲击与尖峰响应高度敏感,特别适合描述滚动轴承故障中常见的瞬态冲击特征。

在实际信号中,噪声通常表现为能量分散、分布较平滑,因此NER和峭度往往较低;而故障信号则由于局部冲击和周期性调制效应,往往在特定频带内表现出更高能量占比和更强冲击性。AFBEM正是利用这两个指标之间的互补性,通过多层感知机对其进行联合建模,输出每个模态/频带的自适应权重,并据此增强故障相关频带、削弱冗余频带。这种基于物理约束的增强机制与纯数据驱动方式不同,它不仅提升了模型的诊断判别能力,还赋予特征选择过程更强的可解释性。

图6 AFBEM结构图

2.5 联合分布对齐模块(JDA)

在完成角域统一表征和物理约束特征提取后,OAIFAN进一步引入联合分布对齐(Joint Distribution Alignment, JDA)损失,对不同源域之间的深层特征进行精细对齐。与仅对齐边缘分布的传统迁移学习方法不同,JDA同时约束不同源域之间的边缘分布和条件分布,从而不仅缩小整体特征分布差异,还促使相同故障类别在不同转速源域中的表示更加紧凑、不同类别之间的表示更加分离。对于跨转速诊断而言,这种“类内一致、类间可分”的精细对齐尤为关键,因为同一故障在不同转速下虽然观测信号表现不同,但其底层物理成因本质一致。通过JDA,OAIFAN能够在多源域之间建立更稳定的类别对应关系,进一步提升对未知目标转速的泛化能力。

  • 实验验证与结果分析

3.1 数据集介绍与实验任务构建

本文采用两个具有代表性的实验平台数据集开展系统验证。首先是由哈尔滨工业大学采集的SpectraQuest MFS数据集,其实验平台如图7所示。该平台可在10 Hz、15 Hz和20 Hz三种典型转速下采集轴承振动信号,包含正常状态、不同程度内圈故障与外圈故障等多类工况。基于该数据集,论文构建了六个多源跨转速诊断任务(T1–T6),分别覆盖轻中度故障场景和较严重故障场景,从而系统评估模型在不同故障复杂度下的泛化能力。

图7 SpectraQuest MFS实验平台图

3.2 MFS数据集上的性能验证

在MFS数据集上,OAIFAN与DFAWNet、CNN-C、IEDGNet、DSDGN、DDTLN、MSiT、DG-Softmax以及KDMUMDAN等多种先进方法进行了全面比较,实验结果如图8所示。结果表明,OAIFAN在六个跨转速任务上均取得最优或近似最优表现,平均准确率达到97.1%,显著优于所有对比方法。与较强基线DG-Softmax相比,OAIFAN提升约5.54个百分点;与Transformer类方法MSiT相比,优势更加显著。这一结果充分说明,与仅依赖深度网络在原始信号上学习域不变表示的方法不同,OAIFAN通过等角重采样主动降低跨转速特征错位,并结合物理约束去噪与JDA精细对齐,能够更有效地提取真正具有迁移价值的故障知识,从而在未知目标转速上取得更高、更稳定的诊断精度。

图8 MFS数据集目标域故障诊断结果图

3.3 去噪与频带增强机理分析

为揭示OAIFAN内部模块的工作机制,论文进一步对DRTDM与AFBEM进行了可视化分析。在DRTDM部分,如图9所示,经过模块处理后,各通道信号中的随机扰动和无关波动被明显削弱,同时多个通道的峭度显著提高,表明噪声被有效抑制,而冲击型故障特征得到了增强。值得注意的是,这种提升不是简单的平滑滤波结果,而是依据信号与噪声在能量分布上的物理差异进行动态阈值判别后实现的,因此更具针对性与可解释性。

图9 DRTDM处理前后各通道信号及峭度变化图

在AFBEM部分,如图10所示,模型能够根据NER和峭度联合生成自适应频带权重,将故障冲击明显集中的通道显著放大,同时压制平稳、冗余或噪声主导的频带。这说明OAIFAN在去噪之后并没有平均对待所有模态,而是进一步通过物理约束完成频带层面的判别性增强,使模型在后续分类阶段能够更加聚焦关键故障信息。

图10 AFBEM频带权重向量可视化图

3.5 特征统一能力与判别特征可视化分析

为了进一步验证OAIFAN在跨转速场景下的特征统一能力,论文对外圈轻微故障(OR2)在600 rpm、900 rpm和1200 rpm三种转速下的包络谱进行了重采样前后对比,如图11所示。结果显示,在原始频谱中,不同转速下的故障特征频率位置明显不同;而在等角重采样后,相同故障在不同转速下对应的故障阶次位置则保持一致。这一结果直接证明,OAIFAN在进入深度网络之前就已经完成了关键的跨转速故障表达统一,为后续域泛化学习创造了更有利的输入空间。

图11 重采样前后包络谱与故障阶次谱对比图

此外,论文还对目标域上的深层特征进行了t-SNE可视化,如图12所示。与其他方法相比,OAIFAN提取的特征表现出更清晰的类间边界和更紧凑的类内聚类结构,尤其显著减轻了外圈轻微故障与严重内圈故障之间的混淆。这表明OAIFAN不仅能够减小域偏移,更能够学习到具有高判别性的故障表示,为模型在未知工况下实现准确诊断提供了坚实支撑。


图12 目标域特征t-SNE可视化图

3.6 消融实验:各模块贡献的系统验证

为了定量验证各组成模块的必要性与有效性,论文开展了系统消融实验,逐步考察等角重采样、DRTDM、AFBEM和JDA四个核心模块对整体性能的影响。实验同时考虑了高斯白噪声与Laplace脉冲噪声两类工业常见干扰,并在不同信噪比条件下比较不同变体的诊断结果,如图13所示。

图13 消融实验结果图

实验结果表明,随着模块逐步加入,模型性能呈现持续上升趋势。仅引入等角重采样时,模型已表现出更好的跨转速稳定性,说明故障表达统一是实现有效域泛化的前提;进一步加入DRTDM后,模型在低信噪比尤其是Laplace脉冲干扰条件下获得明显提升,验证了动态阈值去噪机制在复杂工业噪声环境中的有效性;在此基础上加入AFBEM后,模型对故障敏感频带的关注度进一步增强,诊断精度继续提升;最终,当JDA被纳入完整框架后,OAIFAN在所有噪声类型与信噪比条件下均达到最优表现,说明“统一表征—物理去噪—频带增强—特征对齐”四个模块之间形成了紧密协同,共同构成了模型高鲁棒、高泛化性能的核心来源。

  • 结论

本文围绕工业旋转机械多源跨转速故障迁移诊断中的两大核心问题——不同转速源域之间分布差异显著与工业噪声环境下特征提取不稳定——提出了融合信号处理理论与深度学习的抗噪判别特征统一框架OAIFAN。该方法通过等角重采样将不同转速下的故障信号统一映射到角域中,从源头缓解跨转速特征漂移问题;通过DRTDM和AFBEM将能量分布、冲击特征、NER和峭度等物理先验嵌入网络设计中,实现具有明确物理依据的精准去噪与关键频带增强;并通过JDA进一步促进多源域之间类条件一致性,最终构建出一套兼具高精度、高鲁棒性、轻量化和可部署性的跨转速故障诊断框架。

在两个实验平台、多个跨转速任务以及多种噪声干扰条件下的系统实验表明,OAIFAN在诊断精度、泛化性能、抗噪能力和推理效率等方面均显著优于现有先进方法,充分验证了“物理机理驱动 + 数据驱动学习”深度融合路线在复杂工业故障诊断中的有效性。该工作不仅为跨转速轴承故障迁移诊断提供了一种新的理论与技术方案,也为未来面向跨载荷、复合工况乃至更广泛未知工况的智能泛化诊断研究奠定了坚实基础。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐