1 引言

当前基于机器学习的剩余寿命预测方法的研究异常火爆,其中C-MAPSS数据集在该领域的使用非常广泛,为了方便各位同仁的学习和理解,借此文章向大家简单介绍一下。

2 C-MAPSS数据集介绍

1)首先说明,C-MAPSS数据集为模拟数据。这是由于航空发动机的构造复杂,其气路变化复杂多变;并且航空发动机的运行数据通常作为各个航空公司的保密数据,一般不易获取。因此由NASA使用Commercial Modular Aero-Propulsion System Simulation软件生成了该套数据集,其目的是结合发动机的运行特点,来测试不同的模型性能。
2)NASA提出的涡扇引擎退化监测数据集(C-MPASS)的结构简图如下所示。主要构件包含风扇、低压压气机(LPC)、高压压气机(HPC)、燃烧室、高压涡轮(HPT)、低压涡轮(LPT)及其喷管。
在这里插入图片描述
3)其子数据集共四个,每个子类都有不同数量的工况条件和故障状态。C-MAPSS数据如下图所示。
在这里插入图片描述
4)当前的论文研究中,主要以单工况、单故障状态FD001数据集为主(笔者认为该数据集相对简单,相比于多工况数据,不需要额外的数据处理)。以FD001为例,其进一步分为训练和测试子集,其包含1种故障状态和1种工况。训练集Train_FD001.txt收录了100台保持全寿命循环状态的发动机参数信息;测试集Test_FD001.txt收录了100台非全寿命循环状态的发动机参数信息,即仅包含发动机故障前某个时间终止的多个传感器数据,根据给定的运行参数对每台发动机的RUL进行实时的预测;RUL_FD001.txt中收录了测试集中100台发动机的RUL真实值。每台发动机的参数信息包含3种工作状况监测参数(飞行高度,马赫数,油门杆角度)和21个性能监测参数,其24个传感器监测参数如下图所示。
在这里插入图片描述

3 数据集分析

3.1单工况数据集

1)单工况。笔者认为,所谓的单工况可以理解为飞机巡航时所记录的时间节点,大致可以认为飞机巡航时其工况参数(飞行高度、马赫数和油门杆角度)是不变化的。
2)随机选取FD001训练数据集中的发动机3个性能参数进行可视化分析,如下图所示。图中横坐标代表发动机的运行循环数(所谓运行循环数,是指发动机从出厂到下发的过程中,记录发动机性能参数变化的不同时间节点。直观来讲就是:并非发动机从运行到下发的每一个时间点都记录,只是记录的各个飞行时间段中的某些时间节点。),纵坐标代表各个参数的变化量。其中不同的颜色代表不同的发动机。由图可见,单工况的数据在运行周期内具有明显的单调变化特性,这更有助于机器学习模型对于故障特征的判断。
在这里插入图片描述

3.2 多工况数据集

1)多工况。基于前面的理解,多工况可以理解为包含了发动机从滑跑、起飞、巡航和降落的不同阶段。由于工况的不断变化,其参数的变化特点也更为复杂。
1)随机选取FD002训练数据集中的发动机三个性能参数进行可视化分析,如下图所示。由图可见。多工况的性能参数在运行周期中没有显现出明显的单调特性,这不利于机器学习。相比于单工况,机器学习模型不能有效的学习到关键的退化特征。更详细的介绍可参照论文(赵洪利,张奔,张青.基于工况聚类和残差自注意力的发动机剩余使用寿命预测[J].航空科学技术,2023,34(04):31-40.DOI:10.19452/j.issn1007-5453.2023.04.004.)
在这里插入图片描述
为了更直观的分析,将二者的图合并在一起,如下图所示。
在这里插入图片描述
参考文献:
[1]赵洪利,张奔,张青.基于工况聚类和残差自注意力的发动机剩余使用寿命预测[J].航空科学技术,2023,34(04):31-40.DOI:10.19452/j.issn1007-5453.2023.04.004.

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐