下面整理一份适用于燃气调压器 SCADA 数据建模前的数据问题清单,并给出每类问题的模拟数据样本。字段以最常见的三类数据为主:

字段 含义
time 采集时间
P_in 进口压力,MPa
P_out 出口压力,MPa
Q 流量,Nm³/h
说明 数据问题解释

一、调压器未使用 / 停用数据

问题说明

调压器有些时段没有实际供气,例如:

  • 夜间低负荷;
  • 检修停用;
  • 用户未用气;
  • 备用调压路未启用;
  • 阀门关闭。

此时流量长期为 0 或接近 0,但压力仍可能存在。
如果直接用于故障模型,模型可能误以为“流量为 0”是一种异常故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 00:00 0.42 0.21 0.0 无用气
2026-05-10 00:01 0.42 0.21 0.0 无用气
2026-05-10 00:02 0.41 0.21 0.0 无用气
2026-05-10 00:03 0.42 0.20 0.1 极低流量
2026-05-10 00:04 0.42 0.21 0.0 无用气

判断特征

Q ≈ 0,且持续时间较长

建议处理

这类数据不要直接作为故障样本,应先标记为:

停用状态 / 无用气状态 / 低负荷状态

二、低负荷运行数据

问题说明

调压器虽然在运行,但流量很小。
低流量状态下,出口压力波动规律和正常用气高峰期不同。

例如居民用户凌晨用气很少,流量低,但这不是故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 02:00 0.43 0.215 3.2 低负荷
2026-05-10 02:01 0.43 0.216 2.8 低负荷
2026-05-10 02:02 0.42 0.214 3.5 低负荷
2026-05-10 02:03 0.43 0.217 2.6 低负荷
2026-05-10 02:04 0.42 0.216 3.0 低负荷

判断特征

Q 很小,但不是 0
P_out 基本稳定

建议处理

低负荷数据可以保留,但应单独标记工况:

低负荷正常运行

不要和中高负荷数据混在一起直接训练。


三、正常运行数据

问题说明

正常运行时,进口压力一般高于出口压力,出口压力围绕设定值稳定波动,流量随用户用气变化。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 08:00 0.45 0.210 120 正常运行
2026-05-10 08:01 0.46 0.209 135 正常运行
2026-05-10 08:02 0.45 0.211 142 正常运行
2026-05-10 08:03 0.44 0.208 138 正常运行
2026-05-10 08:04 0.45 0.210 130 正常运行

判断特征

P_in > P_out
P_out 接近设定压力
Q 正常变化

这类数据可以作为正常样本。


四、缺失值问题

问题说明

SCADA 数据中常见缺失值,原因包括:

  • 通信中断;
  • RTU / PLC 掉线;
  • 数据库写入失败;
  • 传感器维护;
  • 网络异常。

缺失值不能简单补 0,因为补 0 会制造虚假故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 09:00 0.45 0.210 128 正常
2026-05-10 09:01 0.45 0.211 132 正常
2026-05-10 09:02 NULL NULL NULL 数据缺失
2026-05-10 09:03 NULL NULL NULL 数据缺失
2026-05-10 09:04 0.46 0.209 130 恢复

判断特征

P_in、P_out、Q 同时为空
或某一个字段为空

建议处理

按缺失时长处理:

缺失情况 处理方式
短时间缺失 插值、前向填充、滑动均值
长时间缺失 删除或标记为通信异常
故障建模阶段 增加缺失标志变量

例如增加字段:

missing_flag = 1

五、重复时间戳问题

问题说明

SCADA 数据写入数据库时,可能同一时间出现多条记录。

原因包括:

  • 数据重复上传;
  • 数据库补写;
  • 采集系统重传;
  • 程序重复入库。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 10:00 0.45 0.210 120 正常
2026-05-10 10:01 0.46 0.211 125 第一条
2026-05-10 10:01 0.46 0.211 125 重复数据
2026-05-10 10:02 0.45 0.209 130 正常
2026-05-10 10:03 0.45 0.210 128 正常

判断特征

同一个 time 出现多条记录

建议处理

若完全相同,可删除重复记录;若数值不同,应按规则聚合:

取均值 / 取最后一条 / 按数据质量标志选择

六、异常尖峰值问题

问题说明

异常尖峰是 SCADA 中非常常见的问题。
比如某一时刻压力突然跳到极大值,但下一时刻又恢复正常。

这通常不是调压器真实故障,而是:

  • 通信误码;
  • 电磁干扰;
  • 传感器瞬时异常;
  • 数据解析错误;
  • 单位换算错误。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 11:00 0.45 0.210 126 正常
2026-05-10 11:01 0.45 0.211 128 正常
2026-05-10 11:02 0.46 3.850 130 出口压力尖峰
2026-05-10 11:03 0.45 0.210 127 恢复正常
2026-05-10 11:04 0.45 0.209 129 正常

判断特征

某一时刻数值远高于前后点
持续时间很短
前后趋势不连续

建议处理

可使用:

3σ规则
箱线图 IQR
滑动窗口中位数
物理阈值过滤

例如:

若 P_out > 设定压力 × 2,且只持续 1 个采样点,可判为尖峰异常

七、异常低值 / 瞬时掉零问题

问题说明

某一时刻压力或流量突然变成 0,但前后都正常,这可能不是实际工况,而是采集异常。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 12:00 0.44 0.210 135 正常
2026-05-10 12:01 0.45 0.211 138 正常
2026-05-10 12:02 0.00 0.000 0 瞬时掉零
2026-05-10 12:03 0.45 0.210 136 恢复
2026-05-10 12:04 0.46 0.209 139 正常

判断特征

P_in、P_out、Q 同时突然变为 0
下一时刻恢复正常

建议处理

如果只持续 1 到 2 个点,可判为采集掉点,而不是调压器故障。


八、传感器卡死 / 数据冻结

问题说明

传感器或通信系统异常时,某个变量会长时间保持完全不变。

比如出口压力连续几十分钟都为 0.210 MPa,但流量和进口压力在变化,这不符合真实运行规律。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 13:00 0.44 0.210 100 出口压力固定
2026-05-10 13:01 0.46 0.210 135 出口压力固定
2026-05-10 13:02 0.43 0.210 160 出口压力固定
2026-05-10 13:03 0.47 0.210 90 出口压力固定
2026-05-10 13:04 0.45 0.210 145 出口压力固定

判断特征

某一变量长时间完全不变
但其他变量明显变化

建议处理

可计算滑动窗口标准差:

std(P_out) = 0
std(Q) > 某阈值
std(P_in) > 某阈值

若满足,则标记:

出口压力传感器卡死

九、传感器漂移

问题说明

传感器漂移不是突然坏掉,而是测量值逐渐偏离真实值。

比如出口压力本来应该稳定在 0.210 MPa,但几小时内慢慢升到 0.260 MPa,没有明显工况变化。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 14:00 0.45 0.210 120 正常
2026-05-10 14:10 0.45 0.218 121 轻微偏高
2026-05-10 14:20 0.46 0.228 119 持续升高
2026-05-10 14:30 0.45 0.239 122 疑似漂移
2026-05-10 14:40 0.45 0.252 120 明显漂移

判断特征

P_out 缓慢单方向变化
Q 和 P_in 基本稳定
无明显工况变化

建议处理

可构造趋势特征:

P_out_slope = 出口压力变化斜率

若压力持续单调偏移,应检查传感器或调压设定。


十、负值异常

问题说明

燃气调压器 SCADA 中,一般情况下压力和流量不应为负值。

负值可能来自:

  • 传感器故障;
  • 数据解析错误;
  • 流量计方向配置错误;
  • 通信错误;
  • 标定异常。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 15:00 0.45 0.210 130 正常
2026-05-10 15:01 0.45 0.211 128 正常
2026-05-10 15:02 0.44 0.210 -85 流量负值异常
2026-05-10 15:03 0.45 0.209 132 恢复
2026-05-10 15:04 0.45 0.210 129 正常

判断特征

P_in < 0
或 P_out < 0
或 Q < 0

建议处理

一般直接标记异常;如果流量计允许双向计量,则需要结合管网方向判断。


十一、出口压力大于进口压力

问题说明

普通燃气调压器是降压设备,通常应满足:

P_in > P_out

如果出现:

P_out > P_in

一般不符合物理规律。

可能原因包括:

  • 进口、出口压力点位接反;
  • 单位不一致;
  • 传感器故障;
  • 数据字段映射错误;
  • 管网特殊倒流工况。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 16:00 0.45 0.210 125 正常
2026-05-10 16:01 0.46 0.211 128 正常
2026-05-10 16:02 0.22 0.410 130 出口压力大于进口压力
2026-05-10 16:03 0.45 0.209 126 恢复正常
2026-05-10 16:04 0.45 0.210 127 正常

判断特征

P_out > P_in

建议处理

先作为物理异常标记,不能直接当作调压器故障。


十二、单位不一致问题

问题说明

SCADA 系统中可能出现单位混用:

  • MPa;
  • kPa;
  • Pa;
  • bar;
  • Nm³/h;
  • m³/h。

例如某个时刻出口压力从 0.210 变成 210,很可能不是压力突变,而是单位从 MPa 变成 kPa。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 17:00 0.45 0.210 130 MPa
2026-05-10 17:01 0.45 0.211 128 MPa
2026-05-10 17:02 450 210 129 疑似变成 kPa
2026-05-10 17:03 0.45 0.209 127 恢复 MPa
2026-05-10 17:04 0.46 0.210 131 MPa

判断特征

数值突然放大 1000 倍左右

建议处理

建立统一单位规则,例如全部转换为:

压力:MPa
流量:Nm³/h

十三、采样频率不一致

问题说明

不同变量采集频率可能不同。

例如:

  • 压力每 1 分钟采集一次;
  • 流量每 5 分钟采集一次;
  • 报警事件实时记录;
  • 维修记录按天记录。

如果不重采样,模型输入会错位。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 18:00 0.45 0.210 120 有流量
2026-05-10 18:01 0.46 0.211 NULL 流量未采集
2026-05-10 18:02 0.45 0.209 NULL 流量未采集
2026-05-10 18:03 0.45 0.210 NULL 流量未采集
2026-05-10 18:04 0.44 0.208 NULL 流量未采集
2026-05-10 18:05 0.45 0.210 135 有流量

判断特征

不同字段的有效采样间隔不同

建议处理

统一时间粒度,例如统一到 1 分钟或 5 分钟:

压力取均值
流量取均值或累计量
报警取是否发生

十四、时间戳不同步

问题说明

进口压力、出口压力、流量看似同一时间,实际可能存在延迟。

例如流量计数据延迟上传 2 分钟,导致压力和流量关系错位。

模拟数据样本

真实过程是:

流量先升高 → 出口压力下降 → 调压器动作 → 出口压力恢复

但采集后可能变成:

time P_in P_out Q 说明
2026-05-10 19:00 0.45 0.210 100 正常
2026-05-10 19:01 0.45 0.198 102 出口压力先下降
2026-05-10 19:02 0.45 0.200 105 压力低
2026-05-10 19:03 0.45 0.208 180 流量延迟显示升高
2026-05-10 19:04 0.45 0.210 185 流量高

问题

模型可能错误学习成:

出口压力下降导致流量升高

而真实关系是:

流量升高导致出口压力短时下降

建议处理

构造滞后特征:

Q(t-1)
Q(t-2)
P_out(t-1)
P_out(t-2)

并分析压力、流量之间的相关滞后关系。


十五、启停过程数据

问题说明

调压器刚开始投入运行或停止运行时,压力和流量会出现过渡波动。

这不一定是故障,而是正常启停过程。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 20:00 0.43 0.210 0 停用
2026-05-10 20:01 0.44 0.205 20 开始用气
2026-05-10 20:02 0.45 0.198 80 过渡波动
2026-05-10 20:03 0.45 0.205 120 逐渐稳定
2026-05-10 20:04 0.45 0.210 130 稳定运行

判断特征

Q 从 0 快速升高
P_out 短时波动
随后恢复稳定

建议处理

启停阶段应单独标记:

启动过程
停机过程
稳定运行

不要直接作为故障样本。


十六、主备调压器切换数据

问题说明

燃气调压站常有主路、备用路或旁通路。
当运行路切换时,某一路的压力和流量可能突然变化。

这可能是正常运行操作,不一定是故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 21:00 0.45 0.210 150 主路运行
2026-05-10 21:01 0.45 0.209 148 主路运行
2026-05-10 21:02 0.45 0.180 60 切换过程
2026-05-10 21:03 0.44 0.150 10 主路退出
2026-05-10 21:04 0.44 0.120 0 主路停用

判断特征

Q 快速下降到 0
P_out 逐步下降
可能伴随阀门状态变化

建议处理

需要结合:

阀门状态
主备路状态
旁通阀状态
检修记录

否则模型可能把“正常切换”误判为“调压器故障”。


十七、上游压力扰动

问题说明

进口压力受上游管网影响。
如果上游压力突然波动,出口压力可能也短暂波动。

这种异常不一定是调压器本身故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 22:00 0.45 0.210 130 正常
2026-05-10 22:01 0.44 0.210 132 正常
2026-05-10 22:02 0.32 0.205 131 上游压力下降
2026-05-10 22:03 0.31 0.198 129 出口压力受影响
2026-05-10 22:04 0.43 0.209 130 恢复

判断特征

P_in 明显波动
P_out 随后轻微波动
Q 变化不大

建议处理

如果只看出口压力,可能误判为调压故障。
因此应加入:

进口压力变化率
上游压力扰动标志
上下游联动分析

十八、下游用户突增用气

问题说明

下游用户突然大量用气时,流量上升,出口压力可能短时下降。
这是正常动态响应,不一定是故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 07:00 0.45 0.210 100 正常
2026-05-10 07:01 0.45 0.205 160 用气增加
2026-05-10 07:02 0.45 0.198 230 流量突增,压力下降
2026-05-10 07:03 0.45 0.203 240 调压器响应
2026-05-10 07:04 0.45 0.209 235 压力恢复

判断特征

Q 快速上升
P_out 短时下降
随后恢复

建议处理

构造动态响应特征:

流量变化率 dQ/dt
出口压力下降幅度
压力恢复时间
压力恢复斜率

十九、出口压力长期偏低

问题说明

出口压力长期低于设定值,可能是真实故障或供气能力不足。

可能原因包括:

  • 调压器阀口堵塞;
  • 调压器开度不足;
  • 过滤器堵塞;
  • 上游压力不足;
  • 下游负荷过大;
  • 调压器选型偏小。

模拟数据样本

假设出口设定压力为:

P_out_set = 0.210 MPa
time P_in P_out Q 说明
2026-05-10 09:00 0.45 0.190 160 出口压力偏低
2026-05-10 09:01 0.45 0.188 165 持续偏低
2026-05-10 09:02 0.46 0.187 168 持续偏低
2026-05-10 09:03 0.45 0.186 170 持续偏低
2026-05-10 09:04 0.45 0.188 166 持续偏低

判断特征

P_out 长时间低于设定压力下限

例如:

P_out < P_out_set - 允许偏差

建议处理

这类数据可能是真实故障候选样本,应结合:

报警记录
维修记录
过滤器压差
阀位
上游压力
下游负荷

二十、出口压力长期偏高

问题说明

出口压力长期高于设定值,风险较高。

可能原因包括:

  • 调压器失灵;
  • 阀口关闭不严;
  • 指挥器故障;
  • 弹簧设定错误;
  • 传感器漂移;
  • 下游流量过低导致关断不严。

模拟数据样本

假设出口设定压力为:

P_out_set = 0.210 MPa
time P_in P_out Q 说明
2026-05-10 10:00 0.45 0.235 80 出口压力偏高
2026-05-10 10:01 0.45 0.238 78 持续偏高
2026-05-10 10:02 0.44 0.240 82 持续偏高
2026-05-10 10:03 0.45 0.239 79 持续偏高
2026-05-10 10:04 0.45 0.241 81 持续偏高

判断特征

P_out 长时间高于设定压力上限

建议处理

这类数据应高度关注,可能属于真实故障或超压风险样本。


二十一、出口压力频繁振荡

问题说明

调压器正常时出口压力应相对稳定。
如果出口压力频繁上下波动,可能说明:

  • 调压器喘振;
  • 调压器响应过快或过慢;
  • 弹簧、膜片、指挥器异常;
  • 下游负荷快速波动;
  • 控制参数不合适。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 11:00 0.45 0.210 130 正常附近
2026-05-10 11:01 0.45 0.225 132 压力升高
2026-05-10 11:02 0.45 0.195 131 压力降低
2026-05-10 11:03 0.45 0.226 130 再次升高
2026-05-10 11:04 0.45 0.196 133 再次降低
2026-05-10 11:05 0.45 0.224 131 持续振荡

判断特征

P_out 在短时间内高低交替变化
波动幅度大
流量变化不明显

可构造特征

P_out_std
P_out_range
P_out_change_count
P_out_fft_energy

二十二、进口压力和出口压力强同步波动

问题说明

正常调压器的作用是稳定出口压力。
如果进口压力波动时,出口压力也几乎同步大幅波动,说明调压器稳压能力可能变差。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 12:00 0.42 0.200 120 同步偏低
2026-05-10 12:01 0.46 0.220 121 同步升高
2026-05-10 12:02 0.40 0.190 119 同步降低
2026-05-10 12:03 0.47 0.225 122 同步升高
2026-05-10 12:04 0.41 0.195 120 同步降低

判断特征

corr(P_in, P_out) 很高
P_out 随 P_in 明显波动

建议处理

可计算滑动窗口相关系数:

rolling_corr(P_in, P_out)

如果相关性异常升高,可能说明调压能力下降。


二十三、流量突变但压力无响应

问题说明

如果流量突然大幅变化,出口压力通常会有一定响应。
如果流量剧烈变化但压力完全不动,可能说明:

  • 压力传感器卡死;
  • 流量数据异常;
  • 时间戳错位;
  • 数据采集不同步。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 13:00 0.45 0.210 80 正常
2026-05-10 13:01 0.45 0.210 90 正常
2026-05-10 13:02 0.45 0.210 260 流量突增
2026-05-10 13:03 0.45 0.210 270 压力无响应
2026-05-10 13:04 0.45 0.210 85 流量恢复

判断特征

Q 变化很大
P_out 完全不变

建议处理

不能直接判断为调压器稳定性好,要先排查压力传感器是否卡死。


二十四、压力突变但流量无变化

问题说明

如果压力突然大幅变化,但流量几乎不变,可能有两类情况:

一类是真实异常:

  • 上游压力扰动;
  • 调压器故障;
  • 阀门动作。

另一类是数据异常:

  • 压力传感器尖峰;
  • 单点采集错误;
  • 数据解析错误。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 14:00 0.45 0.210 120 正常
2026-05-10 14:01 0.45 0.209 121 正常
2026-05-10 14:02 0.45 0.260 120 出口压力突升
2026-05-10 14:03 0.45 0.211 121 恢复
2026-05-10 14:04 0.45 0.210 120 正常

判断特征

P_out 单点突变
Q 无明显变化
下一时刻恢复

建议处理

多数情况下可优先作为尖峰异常处理,而不是故障样本。


二十五、季节性负荷差异

问题说明

燃气负荷有明显季节性。

例如:

  • 冬季采暖流量高;
  • 夏季流量低;
  • 节假日负荷下降;
  • 工作日和周末规律不同。

同样的流量值,在不同季节含义不同。

模拟数据样本

夏季低负荷

time P_in P_out Q 说明
2026-07-10 08:00 0.45 0.210 60 夏季正常
2026-07-10 08:01 0.45 0.211 65 夏季正常
2026-07-10 08:02 0.44 0.210 62 夏季正常

冬季高负荷

time P_in P_out Q 说明
2026-01-10 08:00 0.45 0.208 260 冬季正常
2026-01-10 08:01 0.45 0.207 275 冬季正常
2026-01-10 08:02 0.44 0.206 268 冬季正常

问题

如果不考虑季节,模型可能认为:

冬季高流量 = 异常

但实际上可能是正常采暖负荷。

建议处理

加入时间特征:

month
season
weekday
hour
holiday
temperature

二十六、日周期负荷差异

问题说明

居民、商业、工业用户存在明显日周期。

例如居民用户:

  • 早高峰;
  • 午间小高峰;
  • 晚高峰;
  • 夜间低谷。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 03:00 0.45 0.212 20 夜间低谷
2026-05-10 07:30 0.45 0.206 220 早高峰
2026-05-10 12:00 0.45 0.208 150 午间负荷
2026-05-10 18:30 0.44 0.204 260 晚高峰
2026-05-10 23:30 0.45 0.211 35 夜间下降

建议处理

不能用统一阈值判断所有时段。
应按时段建模:

凌晨
早高峰
日间
晚高峰
夜间

或者加入:

hour_sin
hour_cos

表示周期性。


二十七、不同调压器设备差异

问题说明

不同调压器的参数不同:

  • 出口设定压力不同;
  • 最大流量不同;
  • 进口压力范围不同;
  • 稳压精度不同;
  • 老化程度不同;
  • 用户类型不同。

如果把所有设备直接混合建模,模型可能学到的是“设备差异”,而不是“故障规律”。

模拟数据样本

regulator_id time P_in P_out Q 说明
A 2026-05-10 08:00 0.45 0.210 120 A 设定 0.21 MPa
A 2026-05-10 08:01 0.45 0.211 125 A 正常
B 2026-05-10 08:00 0.60 0.300 300 B 设定 0.30 MPa
B 2026-05-10 08:01 0.61 0.301 310 B 正常

问题

对于 A 来说:

P_out = 0.300 MPa

可能异常。

但对于 B 来说:

P_out = 0.300 MPa

可能完全正常。

建议处理

加入设备基础信息:

regulator_id
P_out_set
rated_flow
device_type
install_year
user_type

或者先按设备分别建模。


二十八、故障标签不准确

问题说明

故障模型最困难的问题之一是标签不准。

常见情况:

  • 维修记录时间不是故障开始时间;
  • 报警时间不是故障发生时间;
  • 故障可能提前几小时或几天出现征兆;
  • 人工记录不规范;
  • 故障修复后仍有过渡数据。

模拟数据样本

维修记录:

record_time event
2026-05-10 15:00 更换调压器膜片

SCADA 数据:

time P_in P_out Q 人工标签 实际情况
2026-05-10 12:00 0.45 0.210 120 正常 正常
2026-05-10 13:00 0.45 0.198 130 正常 异常征兆
2026-05-10 14:00 0.45 0.185 135 正常 故障已出现
2026-05-10 15:00 0.45 0.180 132 故障 维修时间
2026-05-10 16:00 0.45 0.208 128 正常 修复后恢复

问题

如果只把 15:00 标为故障,会漏掉 13:00 到 14:00 的早期异常。

建议处理

标签应分为:

正常期
异常征兆期
故障期
维修期
恢复期

而不是简单分成:

正常 / 故障

二十九、故障样本极少

问题说明

调压器大多数时间正常,真实故障很少。
因此数据通常严重不平衡。

模拟样本分布

类别 样本数量 占比
正常 990,000 99.0%
故障 10,000 1.0%

甚至可能是:

类别 样本数量 占比
正常 999,000 99.9%
故障 1,000 0.1%

问题

模型可能全部预测为正常,也能得到很高准确率:

准确率 = 99.9%

但实际没有识别任何故障。

建议处理

评价指标不能只看准确率,应使用:

召回率 Recall
精确率 Precision
F1-score
AUC
PR-AUC
漏报率
误报率
提前预警时间

建模方法可考虑:

异常检测
半监督学习
一类分类 One-Class SVM
孤立森林 Isolation Forest
自编码器 AutoEncoder
代价敏感学习
样本重采样

三十、报警数据和故障数据不一致

问题说明

SCADA 报警不等于真实故障。

报警可能包括:

  • 阈值报警;
  • 通信报警;
  • 设备报警;
  • 人工确认报警;
  • 瞬时超限报警。

有些报警是误报,有些故障没有报警。

模拟数据样本

time P_in P_out Q alarm 实际情况
2026-05-10 09:00 0.45 0.210 120 0 正常
2026-05-10 09:01 0.45 0.260 121 1 单点尖峰误报
2026-05-10 09:02 0.45 0.211 120 0 正常
2026-05-10 09:03 0.45 0.188 130 0 实际异常但未报警
2026-05-10 09:04 0.45 0.186 132 0 实际异常但未报警

建议处理

不要简单把:

alarm = 1

当作故障标签。

应结合:

报警持续时间
报警类型
维修记录
人工确认
压力偏离程度
恢复情况

三十一、数据字段映射错误

问题说明

系统集成时可能出现字段接错。

例如:

  • 进口压力字段实际存的是出口压力;
  • 流量字段实际存的是累计流量;
  • A 调压器数据接到了 B 调压器;
  • 单位字段没有同步更新。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 10:00 0.210 0.450 120 进口/出口疑似接反
2026-05-10 10:01 0.211 0.451 125 进口/出口疑似接反
2026-05-10 10:02 0.209 0.449 130 进口/出口疑似接反
2026-05-10 10:03 0.210 0.450 128 进口/出口疑似接反

判断特征

长期 P_in < P_out
且数值关系稳定

建议处理

这不是设备故障,而是数据系统问题,需要核查点表。


三十二、累计流量误当瞬时流量

问题说明

有些系统中流量字段可能是:

  • 瞬时流量;
  • 累计流量;
  • 日累计量;
  • 小时累计量。

如果把累计流量当成瞬时流量,会造成严重错误。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 08:00 0.45 0.210 12000 累计流量
2026-05-10 08:01 0.45 0.210 12120 累计流量增加
2026-05-10 08:02 0.45 0.209 12245 累计流量增加
2026-05-10 08:03 0.45 0.210 12370 累计流量增加
2026-05-10 08:04 0.45 0.211 12490 累计流量增加

判断特征

Q 单调递增
不会下降
数值远大于正常瞬时流量

正确处理

应转换为瞬时或周期流量:

Q_interval = Q_cumulative(t) - Q_cumulative(t-1)

三十三、累计流量清零 / 翻转

问题说明

累计流量表可能在某些时刻清零,或者达到最大值后翻转。

模拟数据样本

time P_in P_out Q_cum 说明
2026-05-10 23:56 0.45 0.210 99880 累计流量
2026-05-10 23:57 0.45 0.210 99920 累计流量
2026-05-10 23:58 0.45 0.210 99970 累计流量
2026-05-10 23:59 0.45 0.210 100000 达到上限
2026-05-11 00:00 0.45 0.210 20 清零或翻转

问题

直接计算差分:

20 - 100000 = -99980

会得到一个巨大的负流量。

建议处理

识别清零规则,重新计算周期流量。


三十四、数据噪声过大

问题说明

传感器正常时也会有一定噪声。
如果噪声过大,会影响模型判断。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 15:00 0.451 0.210 120 正常
2026-05-10 15:01 0.443 0.218 118 噪声偏大
2026-05-10 15:02 0.459 0.203 122 噪声偏大
2026-05-10 15:03 0.441 0.219 119 噪声偏大
2026-05-10 15:04 0.462 0.202 121 噪声偏大

判断特征

高频小幅波动明显
但无明确趋势

建议处理

可使用:

滑动平均
中值滤波
低通滤波
卡尔曼滤波

但注意不要把真实故障早期波动也滤掉。


三十五、数据时间间隔不均匀

问题说明

正常情况下应每 1 分钟或固定周期采样。
但实际数据可能时间间隔不均匀。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 16:00 0.45 0.210 120 正常
2026-05-10 16:01 0.45 0.211 123 正常
2026-05-10 16:07 0.46 0.209 130 中间缺 6 分钟
2026-05-10 16:08 0.45 0.210 128 正常
2026-05-10 16:20 0.45 0.210 125 中间缺 12 分钟

判断特征

time_diff 不等于固定采样周期

建议处理

统一重采样到固定时间间隔。


三十六、维修期间数据

问题说明

调压器检修、校准、更换部件期间的数据通常不能代表正常运行,也不能简单视为故障。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 09:00 0.45 0.210 120 正常
2026-05-10 09:30 0.40 0.180 60 开始检修
2026-05-10 10:00 0.00 0.000 0 设备隔离
2026-05-10 10:30 0.46 0.250 20 调试过程
2026-05-10 11:00 0.45 0.210 115 恢复运行

建议处理

结合维修工单,把该区间标记为:

maintenance = 1

一般不作为模型训练的正常或故障样本。


三十七、调压器故障早期征兆数据

问题说明

有些故障不是突然发生,而是逐渐恶化。
例如出口压力恢复越来越慢、波动越来越大、偏离设定值越来越明显。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 08:00 0.45 0.210 120 正常
2026-05-10 09:00 0.45 0.207 130 轻微偏低
2026-05-10 10:00 0.45 0.202 135 偏离增大
2026-05-10 11:00 0.45 0.196 140 疑似异常
2026-05-10 12:00 0.45 0.188 145 故障征兆明显

建议处理

不要只做“当前时刻分类”,应做趋势建模:

过去 10 分钟均值
过去 30 分钟斜率
过去 1 小时偏离程度
压力恢复时间

三十八、真实调压失效数据

问题说明

调压器失效时,出口压力可能不能稳定在设定值附近。

典型表现包括:

  • 出口压力随进口压力变化;
  • 出口压力持续偏高;
  • 出口压力持续偏低;
  • 出口压力波动过大;
  • 负荷变化后恢复慢。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 13:00 0.42 0.198 120 出口压力偏低
2026-05-10 13:01 0.46 0.220 122 出口随进口升高
2026-05-10 13:02 0.40 0.190 121 出口随进口降低
2026-05-10 13:03 0.47 0.226 123 稳压能力差
2026-05-10 13:04 0.41 0.194 120 持续异常

判断特征

P_out 偏离设定值
P_out 与 P_in 高度同步
P_out 波动范围变大

三十九、过滤器堵塞相关数据

问题说明

调压器前过滤器堵塞时,可能导致供气能力下降。
如果没有过滤器前后压差数据,只看进口压力、出口压力、流量,可能表现为:

  • 高流量时出口压力偏低;
  • 流量上不去;
  • 出口压力恢复慢。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 17:00 0.45 0.210 80 低负荷正常
2026-05-10 17:10 0.45 0.205 130 负荷升高
2026-05-10 17:20 0.45 0.195 170 出口压力下降
2026-05-10 17:30 0.45 0.185 190 高负荷下偏低
2026-05-10 17:40 0.45 0.184 190 流量难以上升

建议处理

如果条件允许,应增加:

过滤器前压力
过滤器后压力
过滤器压差

否则容易和调压器本体故障混淆。


四十、下游泄漏或异常耗气

问题说明

如果下游发生泄漏或异常耗气,流量会异常升高,出口压力可能下降。
这不是调压器本体故障,但会影响调压器数据。

模拟数据样本

time P_in P_out Q 说明
2026-05-10 01:00 0.45 0.211 20 夜间正常低流量
2026-05-10 01:10 0.45 0.209 22 正常
2026-05-10 01:20 0.45 0.205 90 夜间异常流量
2026-05-10 01:30 0.45 0.203 95 持续异常
2026-05-10 01:40 0.45 0.204 93 疑似泄漏或异常耗气

判断特征

在本应低负荷时段 Q 异常升高
P_out 可能轻微下降

建议处理

这类数据应作为“下游异常”标记,不应简单归为调压器故障。


四十一、最终汇总表

编号 数据问题 典型表现 是否可直接用于故障建模
1 调压器未使用 Q≈0,压力稳定 否,需标记停用
2 低负荷 Q 很小,压力正常 可用,但需分工况
3 缺失值 NULL、空值 需补全或删除
4 重复时间戳 同一时间多条记录 需去重
5 异常尖峰 单点极大值 通常需剔除
6 瞬时掉零 单点变 0 通常为采集异常
7 数据冻结 长时间不变 传感器/通信异常
8 传感器漂移 缓慢偏离 需趋势识别
9 负值异常 压力或流量为负 需剔除或核查
10 出口大于进口 P_out > P_in 物理异常
11 单位不一致 数值突然放大 需统一单位
12 采样频率不一致 字段更新时间不同 需重采样
13 时间不同步 压力流量错位 需时间对齐
14 启停过程 Q 从 0 突变 单独标记
15 主备切换 流量突变、压力变化 需结合阀门状态
16 上游扰动 P_in 大幅波动 不一定是故障
17 下游用气突增 Q 升高、P_out 短降 可能是正常工况
18 出口长期偏低 P_out 持续低于设定 故障候选
19 出口长期偏高 P_out 持续高于设定 高风险故障候选
20 出口压力振荡 P_out 高频波动 故障候选
21 进口出口同步波动 P_out 随 P_in 波动 调压能力下降候选
22 标签不准确 维修时间不等于故障时间 需重新标注
23 样本不平衡 故障样本极少 需特殊建模
24 报警与故障不一致 报警可能误报漏报 不能直接当标签
25 字段映射错误 点位接反 需核查点表
26 累计流量误用 Q 单调递增 需差分转换
27 维修期间数据 检修、校准、调试 单独剔除或标记
28 下游泄漏 夜间 Q 异常升高 下游异常,不是调压器本体故障

四十二、建议建立的数据清洗标签体系

建模前可以给每条数据增加一个 data_status 字段。

data_status 含义
normal_operation 正常运行
low_load 低负荷
shutdown 停用
startup 启动过程
switching 主备切换
maintenance 检修维护
missing 数据缺失
spike 尖峰异常
zero_drop 瞬时掉零
frozen 数据冻结
drift 传感器漂移
physical_error 物理逻辑错误
upstream_disturbance 上游扰动
downstream_disturbance 下游扰动
suspected_fault 疑似故障
confirmed_fault 确认故障

四十三、推荐建模前的数据处理流程

SCADA 原始数据
        ↓
统一字段名称、单位、时间格式
        ↓
去重、排序、检查采样间隔
        ↓
缺失值识别与处理
        ↓
尖峰、掉零、负值、越界检测
        ↓
传感器卡死、漂移检测
        ↓
物理规则校验:
P_in > P_out
P_out 接近设定值
流量变化与压力响应匹配
        ↓
识别停用、低负荷、启停、切换、维修状态
        ↓
识别上游扰动、下游扰动
        ↓
构造特征:
压差 = P_in - P_out
出口压力偏差 = P_out - P_out_set
流量变化率
压力变化率
压力波动幅度
滞后特征
恢复时间
        ↓
结合报警、维修、巡检记录重新构造标签
        ↓
建立故障识别 / 异常检测 / 预警模型

四十四、最核心的建模提醒

建立燃气调压器故障模型时,不能把所有异常数据都当成故障。

应该区分四类情况:

类型 示例
真实故障 调压失效、出口压力持续偏高、出口压力持续偏低
正常工况变化 低负荷、早晚高峰、启停、主备切换
数据采集异常 缺失、尖峰、卡死、漂移、单位错误
外部系统扰动 上游压力波动、下游突增用气、下游泄漏

一句话总结:

SCADA 原始数据中的“异常”不一定是调压器故障,建模前必须先做数据状态识别、物理规则校验和故障标签修正,否则模型学到的不是故障规律,而是采集噪声、工况变化和错误标签。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐