设备故障预测

设备故障预测是PHM(Prognostics Health Management,故障预测和健康管理)的组成部分,指的是根据系统现在或者历史性能状态预测性地诊断部件或者系统完成其功能的状态(未来的健康状态),包括确定部件或者系统的剩余寿命或者正常工作的时间长度,其中,剩余寿命的研究分为两种:一直是估计或预测平均剩余寿命,另一种是计算剩余寿命的概率分布。

整个PHM方法体系中,预测是实现设备性能退化状态和剩余寿命预测的核心方法,故障预测方法的分类按照主流技术和应用研究有如下三类:基于可靠性模型的方法、基于物理模型的方法、基于数据驱动的方法
在这里插入图片描述

1、基于可靠性模型的故障预测方法

通常基于可靠性模型或基于概率的PHM方法用于从过去的故障历史数据的统计特性角度进行故障预测,相比于其他两类方法,这种方法需要更少的细节信息,因为预测所需要的信息包含在一系列不用的概率密度函数(Probability Density Functions,PDFs,例如指数分布、正态分布、威布尔分布)中,不需要特定的数据或数据模型表述形式。优势在于上述概率密度函数可以通过对统计数据进行分析获得,从而对预测提供足够支持;另外该方法给出的预测结果含有置信度,该参数可以很好地表征预测结果的准确度。

典型的基于统计可靠性的故障概率曲线是著名的“浴盆曲线”。

  • 在设备或系统运行之初,故障率相对较高;
  • 经过一段时间稳定运行后故障率可以保持在相对较低的水准;
  • 而后再经过一段时间运转,故障率又开始增加,直到所有部件或设备出现故障或失效。
    在这里插入图片描述

基于可靠性的故障预测方法应用领域非常广泛,例如:预测汽车的可靠性,对整车的故障间隔里程进行预测——分析各零部件时效的分布规律,采用威布尔分布(一般产品或系统的失效随时间数据的变化趋势很好地符合威布尔分布)来预测汽车部件的寿命。

2、基于物理模型的故障预测方法

基于模型的故障预测技术一般要求对象系统的数学模型是已知的。该方法的典型例子是电池的容量预测,根据已有的历史数据建立容量预测模型,输入是电池的循环充放电周期,训练目标值是电池的容量,剩余寿命根据设定的失效阈值(电池的某个容量值)推算出电池还能有效充放电的周期数。此外,采用这种方法还可以通过对功能损伤的计算来评估关键零部件的损耗程度,实现设备的寿命预测,笔记本电脑的电池就是采用这种方式进行预测的。

该方法与预测对象的物理、电气等属性密切相关,不同的对象部件或单元物理模型差异很大,对物理设备更有效,对复杂的电子系统而言效果很差。因此该方法用在具有相对比较成熟的物理模型的对象包括机械材料、旋转机械部件、锂离子电池、大功率电子元器件等。
在这里插入图片描述

3、基于数据驱动的故障预测方法

在许多情况下,对于由不同信号引发的历史故障数据或者统计数据集,很难确认何种预测模型适用于预测;在研究许多实际的故障预测问题时,建立复杂部件或者系统的数学模型是很困难甚至不可能的,因此部件或者系统设计、仿真、运行和维护等各个阶段的测试、传感器历史数据就成为掌握系统性能下降的主要手段,这种基于测试或者传感器数据进行预测的方法称为数据驱动的故障预测技术。

基于定性分析方法的故障诊断主要通过对系统运行机理、故障特性以及故障行为与成因之间因果关系等先验信息的分析,然后利用逻辑推理的方法实现故障识别与分类。定性分析方法中常见的有专家系统、图搜索(又叫图论方法,包括符号有向图、故障树)、定性仿真。

  • 专家系统——利用长期积累的专家经验来建立针对某一领域的知识库,基于知识库并结合智能计算机程序模拟专家的推理与决策过程,从而实现故障诊断。专家系统是对实际经验的总结,使用简洁,无需建模,能够得到易于理解的诊断结果,因此被广泛使用。

    缺陷在于知识库构建比较困难;标准统一性差;对于规则较多的复杂系统,会有规则冲突与推理漏洞等问题。

  • 图论方法——图论方法是利用图来对设备之间的某种特定关系进行描述,符号有向图方法和故障树方法是故障诊断领域中典型图论方法。符号有向图根据图中各节点的因果关系变化来进行系统故障原因与演化过程的推理。故障树则模仿树的根、节点和枝的生长规律,根据因果关系将事件排列成树形图,再利用反向推理确定故障发生的原因、影响程度及其发生概率。图论方法具有建模简单、应用简便的优点,缺点是比较适用于简单系统,对于复杂系统的故障诊断,诊断精度会随着系统复杂度上升而降低。

  • 定性仿真——定性仿真首先通过表征系统物理参数的定性变量以及各变量之间的定性方程构建系统定性模型,再运用仿真手段获得系统在各类状态下的定性行为描述。定性仿真的优点在于能够对系统的动态行为进行推理,缺点在于无法对未知故障进行准确诊断。

基于定量分析的故障诊断方法可以分为基于分析模型的方法和基于数据驱动的方法

  • 基于分析模型的方法——通过被研究对象的数学模型和可观测输入输出量构造残差信号,在此基础上进行故障诊断。此类方法需要建立在精准数学模型的基础上,进行故障诊断,但是在实际中复杂的系统难以精确建模,因此此类方法在实际应用中有很大局限。

  • 基于数据驱动的方法——通过对系统运行过程中的监测数据进行分析,从而在无精准系统数学模型情况下,对系统进行故障诊断,具体方法包括机器学习、统计分析法和信号分析法
    在这里插入图片描述
    数据驱动故障诊断的原理:数据驱动故障诊断的目标是通过信号处理、特征提取、特征降维、模式识别四步将高维特征向量降维处理转换为判别性能更好的状态标识(低维特征向量或敏感特征),再输入模式识别分类器,实现故障状态的识别和分类,即标识出健康or故障,其中故障又分为多种失效模式。整个阶段分为训练阶段和测试阶段。

    • 训练阶段:训练故障诊断模型——需要大量的历史数据、样本及多维特征,有些历史数据可以通过机理/经验丰富专家的经验对当前状态打标签(如健康/故障是什么等级),但是工业领域的数据多数情况下都缺少标签,要么全部是健康数据,要么根本不知道是故障/健康数据。两种情况分别对应有监督学习和无监督学习,可以运用相应算法训练出故障诊断模型。
    • 测试阶段:测试当前状态识别——将设备的特征提取出来,放到训练好的故障诊断模型里,从而计算出当前的状态标识。

    故障诊断常用算法

    • 支持向量机(Support Vector Machines,SVM)——最早于1963年由VladimirN. Vapnik和Alexey Ya. Chervonenkis提出,利用VC维理论与结构风险最小化原则,利用核函数,将低维空间中线性不可分的点映射到可以能够线性可分的高维空间中,非常适合解决小样本与高维非线性模式识别问题,在故障诊断领域具有非常广泛的应用。
      线性问题:SVM可以实现线性分类,有效解决二分类问题。核心思想是找到最优分类面将正负样本分开,使得样本到分类面的距离尽可能远;二维图里是一条直线,在多维高维空间里则是一个超平面,通过运用数学规划和优化算法,让正负样本到超平面的距离尽可能远,从而找到最优分类面。
      在这里插入图片描述
      非线性可分问题:可以使用1992年提出的核函数技巧(The Kernel Trick)方法,利用函数把低维特征映射到高维空间。常用的核函数包括多项式函数(Polynomial)、高斯函数(Gaussian)、径向基函数(Radial Basis Function)、Sigmoid函数等。在Python和Matlab中都有非常成熟的算法包可以调用,而且也可以选择不同的核函数来解决线性不可分的问题。
      在这里插入图片描述
      多分类的故障诊断问题:例如已知有ABCD四种设备模式,A是健康,BCD是三种不同故障模式,首先可以使用一个分类器去分类健康/故障(A/不是A),之后在不是A的部分中再训练一个分类器来分类(是B故障/不是B故障),简而言之就是层层迭代,通过多种SVM分类器的组合来实现多分类问题。
      除了SVM支持向量机方法,机器学习中还有许多其他常用分类算法,如随机森林、AdaBoosting、人工神经网络等强大的工具,可以更清晰地解决分类问题。这几种方法通常需要有明确的故障标签,是一个有监督的学习过程,而在工业场景中的数据大多都是无标签的/健康的,通常无法满足上述方法的基础条件,需要通过其他方法来解决。

    • 自组织特征映射(Self-Organizing Feature Mapping,SOM)——是一类无监督学习模型,一般的用法是将高维的输入数据在低维空间表示,因此SOM天然是一种降维方法,除了降维,SOM还可以用于数据可视化以及聚类等应用。这种神经网络的典型结构如下图所示,由输入层和竞争层组成,主要完成的任务还是“分类”和“聚类”,聚类的时候也可以看成将目标样本分类,只是没有任何先验知识,目的在于将相似的样本聚合在一起,不相似的样本分离。
      核心机制是竞争学习,首先根据训练数据的样本大小和特征维度来构造初始SOM网络的模型结构,上面每一个神经元通过不同的群众向量来表达;之后基于竞争学习的更新策略不断迭代更新,移动神经元的位置形成不同的最佳匹配神经元(Best Matching Unit,BMU),最大程度靠近所属聚类。
      在这里插入图片描述
      竞争学习的优点在于能够不断学习训练数据的内在模态和模式,形成神经网络模型,把高维特征矩阵转化为二维蜂窝状映射图,实现整个故障的分类。
      在这里插入图片描述
      SOM在进行故障诊断和健康评估时并非完全相同,区别如下:
      (1)在进行故障诊断时,把状态样本放到训练好的SOM模型中计算出BMU,找到所属类别则认为是当前状态的故障类别;
      (2)在健康评估时,需要在上述基础进一步计算当前状态和BMU之间的距离,作为健康状态的评价指标。
      SOM的数据可视化效果非常好,可以把高维数据转化为一个蜂窝状的映射图,映射图是U-matrix,其中不同颜色表示相邻神经元之间的距离,越偏蓝色距离越近,越偏红色距离越远,当出现一片红色的时候表示一个分类面。在实际应用中通常采用Hit map,将测试数据放到训练好的U-matrix中,找到Hit Point所在位置,从而确定故障诊断的分类。
      在这里插入图片描述
      SOM的优点
      (1)主要优点是能够进行无监督学习,即训练样本中不需要知道有多少分类,也无需故障和健康标签,就可以将其分类出来;
      (2)纯粹的数据驱动,可以将数据分类到不同集群中,不需要数据的先验知识;
      (3)在许多不同场景中得到了广泛应用
      SOM的缺点
      (1)为了生成一个没有缺失值的映射图,需要为每个样本的维度设置一个值;
      (2)每个SOM模型都不同,从同样样本向量中可能会发现不同的相似性,有一些随机性的干扰;
      (3)为了得到一个好的映射图,需要构建许多映射图;
      (4)计算量非常大。

    • 贝叶斯网络(Bayesian network)——上述方法都是从数据本身出发,无需任何数据先验知识,而工业领域专家们的经验是非常重要的一部分,在贝叶斯网络中可以把专家经验统计起来形成条件概率(A=j | B=i)来描述不同事件之间的因果关系。
      贝叶斯定理:P(A|B)=P(B|A)P(A)/P(B)
      贝叶斯网络是用图模型的结构,把整个复杂系统中所有可能情况结构化地表达出来。在
      有向无环图
      用节点表示随机变量,箭头表示条件依赖,有向边给出因果关系,通过统计所有依赖关系得出条件概率分布图。
      在这里插入图片描述

4、案例分析——轴承故障诊断

轴承作为典型的旋转类设备,一般通过振动信号进行故障诊断,如下图所示,下图是采集到的多种模式的振动信号,可能由多种故障耦合在一起,无法直观地判断其故障,下面通过自组织映射神经网络SOM的方法进行故障诊断。
轴承振动图谱
(1)准备数据集,确定类标签;
故障类型
(2)根据需要的详细程度确定显示大小;
(3)选择SOM模型的网络模式;
(4)设置SOM超参数,包括初始权重、学习率等;
(5)训练SOM模型,并用Hit-point测试SOM模型。
在这里插入图片描述
训练出的模型如下图左所示,可以通过SOM将八类故障清晰区分出来,在模型测试时将新的特征数据(即需要测试的样本)放到SOM U-matrix模型计算后,其位置如上图右红点所示,与八种故障类型的标签进行对比即可判断出其属于第四类故障。

5、总结

故障预测方法的分类按照主流技术和应用研究有如下三类:基于可靠性模型的方法、基于物理模型的方法、基于数据驱动的方法,而基于数据驱动的故障预测方法又是目前应用比较广泛的方法,基于此衍生出两类故障诊断方式:基于定性分析方法的故障诊断和基于定量分析方法的故障诊断
基于定量分析方法的故障诊断的一个分支——基于数据驱动的故障诊断问题就是将高维的特征向量转换为状态标识。①对于有标签的数据,通常采用分类算法,常用的是支持向量机SVM,如果遇到一些线性不可分的情况,可以用核函数的技巧把低维特征映射到高维空间中,从而扩展到多分类问题;②面对类别数量未知、无标签的数据,通常采用自组织映射神经网络SOM,可视化效果好;③如果要加入先验知识,则采用贝叶斯网络,可以将每种特征和故障类型之间的关联关系通过机理固化。
在这里插入图片描述

名词解释

  1. 韦布尔分布——即韦伯分布(Weibull distribution),又称韦氏分布或威布尔分布,是可靠性分析和寿命检验的理论基础。威布尔分布在可靠性工程中被广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式,由于它可以利用概率值很容易地推断出它的分布参数,被广泛应用于各种寿命试验的数据处理。
  2. 最佳匹配神经元(Best Matching Unit,BMU)——将训练数据输入到网络中时,会计算出所有权重向量的欧几里得距离,权重向量与输入最相似的神经元成为最佳匹配单元BMU,BMU的权重和SOM网格中靠近它的神经元会朝着输入矢量的方向调整,再定了BMU之后,下一步是计算哪些节点在其邻域内。
  3. 故障诊断——指故障发生了,确实影响到设备的安全、性能、可用性之后,判断故障的原因什么。故障是一种表现,而触发这种故障的原因可能有多种,通常需要故障诊断工程师配合经验、数据、现场勘查才能判断故障原因。
  4. 故障预测——是指故障尚未发生,但通过某些迹象(一般是指各种传感器信号),判断设备可能存在异常。这种判断可以通过某种模型或者算法进行初筛,然后通过人工确认后,再向设备工程师发出警告,最终现场确认设备是否存在故障,或者故障趋势。
  5. 健康管理——是基于故障预测对设备完好性、可用性的评估和控制。故障预测是针对某个具体部件的故障迹象的预判,而健康管理是多部件多维度的综合评价,从宏观上给出设备的健康评分,这个评分可以用来指导设备的定制化维护、备件的综合调度等等。
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐