燃气调压器数据可能存在的问题
下面整理一份适用于燃气调压器 SCADA 数据建模前的数据问题清单,并给出每类问题的模拟数据样本。字段以最常见的三类数据为主:
| 字段 | 含义 |
|---|---|
time |
采集时间 |
P_in |
进口压力,MPa |
P_out |
出口压力,MPa |
Q |
流量,Nm³/h |
说明 |
数据问题解释 |
一、调压器未使用 / 停用数据
问题说明
调压器有些时段没有实际供气,例如:
- 夜间低负荷;
- 检修停用;
- 用户未用气;
- 备用调压路未启用;
- 阀门关闭。
此时流量长期为 0 或接近 0,但压力仍可能存在。
如果直接用于故障模型,模型可能误以为“流量为 0”是一种异常故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 00:00 | 0.42 | 0.21 | 0.0 | 无用气 |
| 2026-05-10 00:01 | 0.42 | 0.21 | 0.0 | 无用气 |
| 2026-05-10 00:02 | 0.41 | 0.21 | 0.0 | 无用气 |
| 2026-05-10 00:03 | 0.42 | 0.20 | 0.1 | 极低流量 |
| 2026-05-10 00:04 | 0.42 | 0.21 | 0.0 | 无用气 |
判断特征
Q ≈ 0,且持续时间较长
建议处理
这类数据不要直接作为故障样本,应先标记为:
停用状态 / 无用气状态 / 低负荷状态
二、低负荷运行数据
问题说明
调压器虽然在运行,但流量很小。
低流量状态下,出口压力波动规律和正常用气高峰期不同。
例如居民用户凌晨用气很少,流量低,但这不是故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 02:00 | 0.43 | 0.215 | 3.2 | 低负荷 |
| 2026-05-10 02:01 | 0.43 | 0.216 | 2.8 | 低负荷 |
| 2026-05-10 02:02 | 0.42 | 0.214 | 3.5 | 低负荷 |
| 2026-05-10 02:03 | 0.43 | 0.217 | 2.6 | 低负荷 |
| 2026-05-10 02:04 | 0.42 | 0.216 | 3.0 | 低负荷 |
判断特征
Q 很小,但不是 0
P_out 基本稳定
建议处理
低负荷数据可以保留,但应单独标记工况:
低负荷正常运行
不要和中高负荷数据混在一起直接训练。
三、正常运行数据
问题说明
正常运行时,进口压力一般高于出口压力,出口压力围绕设定值稳定波动,流量随用户用气变化。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 08:00 | 0.45 | 0.210 | 120 | 正常运行 |
| 2026-05-10 08:01 | 0.46 | 0.209 | 135 | 正常运行 |
| 2026-05-10 08:02 | 0.45 | 0.211 | 142 | 正常运行 |
| 2026-05-10 08:03 | 0.44 | 0.208 | 138 | 正常运行 |
| 2026-05-10 08:04 | 0.45 | 0.210 | 130 | 正常运行 |
判断特征
P_in > P_out
P_out 接近设定压力
Q 正常变化
这类数据可以作为正常样本。
四、缺失值问题
问题说明
SCADA 数据中常见缺失值,原因包括:
- 通信中断;
- RTU / PLC 掉线;
- 数据库写入失败;
- 传感器维护;
- 网络异常。
缺失值不能简单补 0,因为补 0 会制造虚假故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 09:00 | 0.45 | 0.210 | 128 | 正常 |
| 2026-05-10 09:01 | 0.45 | 0.211 | 132 | 正常 |
| 2026-05-10 09:02 | NULL | NULL | NULL | 数据缺失 |
| 2026-05-10 09:03 | NULL | NULL | NULL | 数据缺失 |
| 2026-05-10 09:04 | 0.46 | 0.209 | 130 | 恢复 |
判断特征
P_in、P_out、Q 同时为空
或某一个字段为空
建议处理
按缺失时长处理:
| 缺失情况 | 处理方式 |
|---|---|
| 短时间缺失 | 插值、前向填充、滑动均值 |
| 长时间缺失 | 删除或标记为通信异常 |
| 故障建模阶段 | 增加缺失标志变量 |
例如增加字段:
missing_flag = 1
五、重复时间戳问题
问题说明
SCADA 数据写入数据库时,可能同一时间出现多条记录。
原因包括:
- 数据重复上传;
- 数据库补写;
- 采集系统重传;
- 程序重复入库。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 10:00 | 0.45 | 0.210 | 120 | 正常 |
| 2026-05-10 10:01 | 0.46 | 0.211 | 125 | 第一条 |
| 2026-05-10 10:01 | 0.46 | 0.211 | 125 | 重复数据 |
| 2026-05-10 10:02 | 0.45 | 0.209 | 130 | 正常 |
| 2026-05-10 10:03 | 0.45 | 0.210 | 128 | 正常 |
判断特征
同一个 time 出现多条记录
建议处理
若完全相同,可删除重复记录;若数值不同,应按规则聚合:
取均值 / 取最后一条 / 按数据质量标志选择
六、异常尖峰值问题
问题说明
异常尖峰是 SCADA 中非常常见的问题。
比如某一时刻压力突然跳到极大值,但下一时刻又恢复正常。
这通常不是调压器真实故障,而是:
- 通信误码;
- 电磁干扰;
- 传感器瞬时异常;
- 数据解析错误;
- 单位换算错误。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 11:00 | 0.45 | 0.210 | 126 | 正常 |
| 2026-05-10 11:01 | 0.45 | 0.211 | 128 | 正常 |
| 2026-05-10 11:02 | 0.46 | 3.850 | 130 | 出口压力尖峰 |
| 2026-05-10 11:03 | 0.45 | 0.210 | 127 | 恢复正常 |
| 2026-05-10 11:04 | 0.45 | 0.209 | 129 | 正常 |
判断特征
某一时刻数值远高于前后点
持续时间很短
前后趋势不连续
建议处理
可使用:
3σ规则
箱线图 IQR
滑动窗口中位数
物理阈值过滤
例如:
若 P_out > 设定压力 × 2,且只持续 1 个采样点,可判为尖峰异常
七、异常低值 / 瞬时掉零问题
问题说明
某一时刻压力或流量突然变成 0,但前后都正常,这可能不是实际工况,而是采集异常。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 12:00 | 0.44 | 0.210 | 135 | 正常 |
| 2026-05-10 12:01 | 0.45 | 0.211 | 138 | 正常 |
| 2026-05-10 12:02 | 0.00 | 0.000 | 0 | 瞬时掉零 |
| 2026-05-10 12:03 | 0.45 | 0.210 | 136 | 恢复 |
| 2026-05-10 12:04 | 0.46 | 0.209 | 139 | 正常 |
判断特征
P_in、P_out、Q 同时突然变为 0
下一时刻恢复正常
建议处理
如果只持续 1 到 2 个点,可判为采集掉点,而不是调压器故障。
八、传感器卡死 / 数据冻结
问题说明
传感器或通信系统异常时,某个变量会长时间保持完全不变。
比如出口压力连续几十分钟都为 0.210 MPa,但流量和进口压力在变化,这不符合真实运行规律。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 13:00 | 0.44 | 0.210 | 100 | 出口压力固定 |
| 2026-05-10 13:01 | 0.46 | 0.210 | 135 | 出口压力固定 |
| 2026-05-10 13:02 | 0.43 | 0.210 | 160 | 出口压力固定 |
| 2026-05-10 13:03 | 0.47 | 0.210 | 90 | 出口压力固定 |
| 2026-05-10 13:04 | 0.45 | 0.210 | 145 | 出口压力固定 |
判断特征
某一变量长时间完全不变
但其他变量明显变化
建议处理
可计算滑动窗口标准差:
std(P_out) = 0
std(Q) > 某阈值
std(P_in) > 某阈值
若满足,则标记:
出口压力传感器卡死
九、传感器漂移
问题说明
传感器漂移不是突然坏掉,而是测量值逐渐偏离真实值。
比如出口压力本来应该稳定在 0.210 MPa,但几小时内慢慢升到 0.260 MPa,没有明显工况变化。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 14:00 | 0.45 | 0.210 | 120 | 正常 |
| 2026-05-10 14:10 | 0.45 | 0.218 | 121 | 轻微偏高 |
| 2026-05-10 14:20 | 0.46 | 0.228 | 119 | 持续升高 |
| 2026-05-10 14:30 | 0.45 | 0.239 | 122 | 疑似漂移 |
| 2026-05-10 14:40 | 0.45 | 0.252 | 120 | 明显漂移 |
判断特征
P_out 缓慢单方向变化
Q 和 P_in 基本稳定
无明显工况变化
建议处理
可构造趋势特征:
P_out_slope = 出口压力变化斜率
若压力持续单调偏移,应检查传感器或调压设定。
十、负值异常
问题说明
燃气调压器 SCADA 中,一般情况下压力和流量不应为负值。
负值可能来自:
- 传感器故障;
- 数据解析错误;
- 流量计方向配置错误;
- 通信错误;
- 标定异常。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 15:00 | 0.45 | 0.210 | 130 | 正常 |
| 2026-05-10 15:01 | 0.45 | 0.211 | 128 | 正常 |
| 2026-05-10 15:02 | 0.44 | 0.210 | -85 | 流量负值异常 |
| 2026-05-10 15:03 | 0.45 | 0.209 | 132 | 恢复 |
| 2026-05-10 15:04 | 0.45 | 0.210 | 129 | 正常 |
判断特征
P_in < 0
或 P_out < 0
或 Q < 0
建议处理
一般直接标记异常;如果流量计允许双向计量,则需要结合管网方向判断。
十一、出口压力大于进口压力
问题说明
普通燃气调压器是降压设备,通常应满足:
P_in > P_out
如果出现:
P_out > P_in
一般不符合物理规律。
可能原因包括:
- 进口、出口压力点位接反;
- 单位不一致;
- 传感器故障;
- 数据字段映射错误;
- 管网特殊倒流工况。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 16:00 | 0.45 | 0.210 | 125 | 正常 |
| 2026-05-10 16:01 | 0.46 | 0.211 | 128 | 正常 |
| 2026-05-10 16:02 | 0.22 | 0.410 | 130 | 出口压力大于进口压力 |
| 2026-05-10 16:03 | 0.45 | 0.209 | 126 | 恢复正常 |
| 2026-05-10 16:04 | 0.45 | 0.210 | 127 | 正常 |
判断特征
P_out > P_in
建议处理
先作为物理异常标记,不能直接当作调压器故障。
十二、单位不一致问题
问题说明
SCADA 系统中可能出现单位混用:
- MPa;
- kPa;
- Pa;
- bar;
- Nm³/h;
- m³/h。
例如某个时刻出口压力从 0.210 变成 210,很可能不是压力突变,而是单位从 MPa 变成 kPa。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 17:00 | 0.45 | 0.210 | 130 | MPa |
| 2026-05-10 17:01 | 0.45 | 0.211 | 128 | MPa |
| 2026-05-10 17:02 | 450 | 210 | 129 | 疑似变成 kPa |
| 2026-05-10 17:03 | 0.45 | 0.209 | 127 | 恢复 MPa |
| 2026-05-10 17:04 | 0.46 | 0.210 | 131 | MPa |
判断特征
数值突然放大 1000 倍左右
建议处理
建立统一单位规则,例如全部转换为:
压力:MPa
流量:Nm³/h
十三、采样频率不一致
问题说明
不同变量采集频率可能不同。
例如:
- 压力每 1 分钟采集一次;
- 流量每 5 分钟采集一次;
- 报警事件实时记录;
- 维修记录按天记录。
如果不重采样,模型输入会错位。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 18:00 | 0.45 | 0.210 | 120 | 有流量 |
| 2026-05-10 18:01 | 0.46 | 0.211 | NULL | 流量未采集 |
| 2026-05-10 18:02 | 0.45 | 0.209 | NULL | 流量未采集 |
| 2026-05-10 18:03 | 0.45 | 0.210 | NULL | 流量未采集 |
| 2026-05-10 18:04 | 0.44 | 0.208 | NULL | 流量未采集 |
| 2026-05-10 18:05 | 0.45 | 0.210 | 135 | 有流量 |
判断特征
不同字段的有效采样间隔不同
建议处理
统一时间粒度,例如统一到 1 分钟或 5 分钟:
压力取均值
流量取均值或累计量
报警取是否发生
十四、时间戳不同步
问题说明
进口压力、出口压力、流量看似同一时间,实际可能存在延迟。
例如流量计数据延迟上传 2 分钟,导致压力和流量关系错位。
模拟数据样本
真实过程是:
流量先升高 → 出口压力下降 → 调压器动作 → 出口压力恢复
但采集后可能变成:
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 19:00 | 0.45 | 0.210 | 100 | 正常 |
| 2026-05-10 19:01 | 0.45 | 0.198 | 102 | 出口压力先下降 |
| 2026-05-10 19:02 | 0.45 | 0.200 | 105 | 压力低 |
| 2026-05-10 19:03 | 0.45 | 0.208 | 180 | 流量延迟显示升高 |
| 2026-05-10 19:04 | 0.45 | 0.210 | 185 | 流量高 |
问题
模型可能错误学习成:
出口压力下降导致流量升高
而真实关系是:
流量升高导致出口压力短时下降
建议处理
构造滞后特征:
Q(t-1)
Q(t-2)
P_out(t-1)
P_out(t-2)
并分析压力、流量之间的相关滞后关系。
十五、启停过程数据
问题说明
调压器刚开始投入运行或停止运行时,压力和流量会出现过渡波动。
这不一定是故障,而是正常启停过程。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 20:00 | 0.43 | 0.210 | 0 | 停用 |
| 2026-05-10 20:01 | 0.44 | 0.205 | 20 | 开始用气 |
| 2026-05-10 20:02 | 0.45 | 0.198 | 80 | 过渡波动 |
| 2026-05-10 20:03 | 0.45 | 0.205 | 120 | 逐渐稳定 |
| 2026-05-10 20:04 | 0.45 | 0.210 | 130 | 稳定运行 |
判断特征
Q 从 0 快速升高
P_out 短时波动
随后恢复稳定
建议处理
启停阶段应单独标记:
启动过程
停机过程
稳定运行
不要直接作为故障样本。
十六、主备调压器切换数据
问题说明
燃气调压站常有主路、备用路或旁通路。
当运行路切换时,某一路的压力和流量可能突然变化。
这可能是正常运行操作,不一定是故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 21:00 | 0.45 | 0.210 | 150 | 主路运行 |
| 2026-05-10 21:01 | 0.45 | 0.209 | 148 | 主路运行 |
| 2026-05-10 21:02 | 0.45 | 0.180 | 60 | 切换过程 |
| 2026-05-10 21:03 | 0.44 | 0.150 | 10 | 主路退出 |
| 2026-05-10 21:04 | 0.44 | 0.120 | 0 | 主路停用 |
判断特征
Q 快速下降到 0
P_out 逐步下降
可能伴随阀门状态变化
建议处理
需要结合:
阀门状态
主备路状态
旁通阀状态
检修记录
否则模型可能把“正常切换”误判为“调压器故障”。
十七、上游压力扰动
问题说明
进口压力受上游管网影响。
如果上游压力突然波动,出口压力可能也短暂波动。
这种异常不一定是调压器本身故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 22:00 | 0.45 | 0.210 | 130 | 正常 |
| 2026-05-10 22:01 | 0.44 | 0.210 | 132 | 正常 |
| 2026-05-10 22:02 | 0.32 | 0.205 | 131 | 上游压力下降 |
| 2026-05-10 22:03 | 0.31 | 0.198 | 129 | 出口压力受影响 |
| 2026-05-10 22:04 | 0.43 | 0.209 | 130 | 恢复 |
判断特征
P_in 明显波动
P_out 随后轻微波动
Q 变化不大
建议处理
如果只看出口压力,可能误判为调压故障。
因此应加入:
进口压力变化率
上游压力扰动标志
上下游联动分析
十八、下游用户突增用气
问题说明
下游用户突然大量用气时,流量上升,出口压力可能短时下降。
这是正常动态响应,不一定是故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 07:00 | 0.45 | 0.210 | 100 | 正常 |
| 2026-05-10 07:01 | 0.45 | 0.205 | 160 | 用气增加 |
| 2026-05-10 07:02 | 0.45 | 0.198 | 230 | 流量突增,压力下降 |
| 2026-05-10 07:03 | 0.45 | 0.203 | 240 | 调压器响应 |
| 2026-05-10 07:04 | 0.45 | 0.209 | 235 | 压力恢复 |
判断特征
Q 快速上升
P_out 短时下降
随后恢复
建议处理
构造动态响应特征:
流量变化率 dQ/dt
出口压力下降幅度
压力恢复时间
压力恢复斜率
十九、出口压力长期偏低
问题说明
出口压力长期低于设定值,可能是真实故障或供气能力不足。
可能原因包括:
- 调压器阀口堵塞;
- 调压器开度不足;
- 过滤器堵塞;
- 上游压力不足;
- 下游负荷过大;
- 调压器选型偏小。
模拟数据样本
假设出口设定压力为:
P_out_set = 0.210 MPa
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 09:00 | 0.45 | 0.190 | 160 | 出口压力偏低 |
| 2026-05-10 09:01 | 0.45 | 0.188 | 165 | 持续偏低 |
| 2026-05-10 09:02 | 0.46 | 0.187 | 168 | 持续偏低 |
| 2026-05-10 09:03 | 0.45 | 0.186 | 170 | 持续偏低 |
| 2026-05-10 09:04 | 0.45 | 0.188 | 166 | 持续偏低 |
判断特征
P_out 长时间低于设定压力下限
例如:
P_out < P_out_set - 允许偏差
建议处理
这类数据可能是真实故障候选样本,应结合:
报警记录
维修记录
过滤器压差
阀位
上游压力
下游负荷
二十、出口压力长期偏高
问题说明
出口压力长期高于设定值,风险较高。
可能原因包括:
- 调压器失灵;
- 阀口关闭不严;
- 指挥器故障;
- 弹簧设定错误;
- 传感器漂移;
- 下游流量过低导致关断不严。
模拟数据样本
假设出口设定压力为:
P_out_set = 0.210 MPa
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 10:00 | 0.45 | 0.235 | 80 | 出口压力偏高 |
| 2026-05-10 10:01 | 0.45 | 0.238 | 78 | 持续偏高 |
| 2026-05-10 10:02 | 0.44 | 0.240 | 82 | 持续偏高 |
| 2026-05-10 10:03 | 0.45 | 0.239 | 79 | 持续偏高 |
| 2026-05-10 10:04 | 0.45 | 0.241 | 81 | 持续偏高 |
判断特征
P_out 长时间高于设定压力上限
建议处理
这类数据应高度关注,可能属于真实故障或超压风险样本。
二十一、出口压力频繁振荡
问题说明
调压器正常时出口压力应相对稳定。
如果出口压力频繁上下波动,可能说明:
- 调压器喘振;
- 调压器响应过快或过慢;
- 弹簧、膜片、指挥器异常;
- 下游负荷快速波动;
- 控制参数不合适。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 11:00 | 0.45 | 0.210 | 130 | 正常附近 |
| 2026-05-10 11:01 | 0.45 | 0.225 | 132 | 压力升高 |
| 2026-05-10 11:02 | 0.45 | 0.195 | 131 | 压力降低 |
| 2026-05-10 11:03 | 0.45 | 0.226 | 130 | 再次升高 |
| 2026-05-10 11:04 | 0.45 | 0.196 | 133 | 再次降低 |
| 2026-05-10 11:05 | 0.45 | 0.224 | 131 | 持续振荡 |
判断特征
P_out 在短时间内高低交替变化
波动幅度大
流量变化不明显
可构造特征
P_out_std
P_out_range
P_out_change_count
P_out_fft_energy
二十二、进口压力和出口压力强同步波动
问题说明
正常调压器的作用是稳定出口压力。
如果进口压力波动时,出口压力也几乎同步大幅波动,说明调压器稳压能力可能变差。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 12:00 | 0.42 | 0.200 | 120 | 同步偏低 |
| 2026-05-10 12:01 | 0.46 | 0.220 | 121 | 同步升高 |
| 2026-05-10 12:02 | 0.40 | 0.190 | 119 | 同步降低 |
| 2026-05-10 12:03 | 0.47 | 0.225 | 122 | 同步升高 |
| 2026-05-10 12:04 | 0.41 | 0.195 | 120 | 同步降低 |
判断特征
corr(P_in, P_out) 很高
P_out 随 P_in 明显波动
建议处理
可计算滑动窗口相关系数:
rolling_corr(P_in, P_out)
如果相关性异常升高,可能说明调压能力下降。
二十三、流量突变但压力无响应
问题说明
如果流量突然大幅变化,出口压力通常会有一定响应。
如果流量剧烈变化但压力完全不动,可能说明:
- 压力传感器卡死;
- 流量数据异常;
- 时间戳错位;
- 数据采集不同步。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 13:00 | 0.45 | 0.210 | 80 | 正常 |
| 2026-05-10 13:01 | 0.45 | 0.210 | 90 | 正常 |
| 2026-05-10 13:02 | 0.45 | 0.210 | 260 | 流量突增 |
| 2026-05-10 13:03 | 0.45 | 0.210 | 270 | 压力无响应 |
| 2026-05-10 13:04 | 0.45 | 0.210 | 85 | 流量恢复 |
判断特征
Q 变化很大
P_out 完全不变
建议处理
不能直接判断为调压器稳定性好,要先排查压力传感器是否卡死。
二十四、压力突变但流量无变化
问题说明
如果压力突然大幅变化,但流量几乎不变,可能有两类情况:
一类是真实异常:
- 上游压力扰动;
- 调压器故障;
- 阀门动作。
另一类是数据异常:
- 压力传感器尖峰;
- 单点采集错误;
- 数据解析错误。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 14:00 | 0.45 | 0.210 | 120 | 正常 |
| 2026-05-10 14:01 | 0.45 | 0.209 | 121 | 正常 |
| 2026-05-10 14:02 | 0.45 | 0.260 | 120 | 出口压力突升 |
| 2026-05-10 14:03 | 0.45 | 0.211 | 121 | 恢复 |
| 2026-05-10 14:04 | 0.45 | 0.210 | 120 | 正常 |
判断特征
P_out 单点突变
Q 无明显变化
下一时刻恢复
建议处理
多数情况下可优先作为尖峰异常处理,而不是故障样本。
二十五、季节性负荷差异
问题说明
燃气负荷有明显季节性。
例如:
- 冬季采暖流量高;
- 夏季流量低;
- 节假日负荷下降;
- 工作日和周末规律不同。
同样的流量值,在不同季节含义不同。
模拟数据样本
夏季低负荷
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-07-10 08:00 | 0.45 | 0.210 | 60 | 夏季正常 |
| 2026-07-10 08:01 | 0.45 | 0.211 | 65 | 夏季正常 |
| 2026-07-10 08:02 | 0.44 | 0.210 | 62 | 夏季正常 |
冬季高负荷
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-01-10 08:00 | 0.45 | 0.208 | 260 | 冬季正常 |
| 2026-01-10 08:01 | 0.45 | 0.207 | 275 | 冬季正常 |
| 2026-01-10 08:02 | 0.44 | 0.206 | 268 | 冬季正常 |
问题
如果不考虑季节,模型可能认为:
冬季高流量 = 异常
但实际上可能是正常采暖负荷。
建议处理
加入时间特征:
month
season
weekday
hour
holiday
temperature
二十六、日周期负荷差异
问题说明
居民、商业、工业用户存在明显日周期。
例如居民用户:
- 早高峰;
- 午间小高峰;
- 晚高峰;
- 夜间低谷。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 03:00 | 0.45 | 0.212 | 20 | 夜间低谷 |
| 2026-05-10 07:30 | 0.45 | 0.206 | 220 | 早高峰 |
| 2026-05-10 12:00 | 0.45 | 0.208 | 150 | 午间负荷 |
| 2026-05-10 18:30 | 0.44 | 0.204 | 260 | 晚高峰 |
| 2026-05-10 23:30 | 0.45 | 0.211 | 35 | 夜间下降 |
建议处理
不能用统一阈值判断所有时段。
应按时段建模:
凌晨
早高峰
日间
晚高峰
夜间
或者加入:
hour_sin
hour_cos
表示周期性。
二十七、不同调压器设备差异
问题说明
不同调压器的参数不同:
- 出口设定压力不同;
- 最大流量不同;
- 进口压力范围不同;
- 稳压精度不同;
- 老化程度不同;
- 用户类型不同。
如果把所有设备直接混合建模,模型可能学到的是“设备差异”,而不是“故障规律”。
模拟数据样本
| regulator_id | time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|---|
| A | 2026-05-10 08:00 | 0.45 | 0.210 | 120 | A 设定 0.21 MPa |
| A | 2026-05-10 08:01 | 0.45 | 0.211 | 125 | A 正常 |
| B | 2026-05-10 08:00 | 0.60 | 0.300 | 300 | B 设定 0.30 MPa |
| B | 2026-05-10 08:01 | 0.61 | 0.301 | 310 | B 正常 |
问题
对于 A 来说:
P_out = 0.300 MPa
可能异常。
但对于 B 来说:
P_out = 0.300 MPa
可能完全正常。
建议处理
加入设备基础信息:
regulator_id
P_out_set
rated_flow
device_type
install_year
user_type
或者先按设备分别建模。
二十八、故障标签不准确
问题说明
故障模型最困难的问题之一是标签不准。
常见情况:
- 维修记录时间不是故障开始时间;
- 报警时间不是故障发生时间;
- 故障可能提前几小时或几天出现征兆;
- 人工记录不规范;
- 故障修复后仍有过渡数据。
模拟数据样本
维修记录:
| record_time | event |
|---|---|
| 2026-05-10 15:00 | 更换调压器膜片 |
SCADA 数据:
| time | P_in | P_out | Q | 人工标签 | 实际情况 |
|---|---|---|---|---|---|
| 2026-05-10 12:00 | 0.45 | 0.210 | 120 | 正常 | 正常 |
| 2026-05-10 13:00 | 0.45 | 0.198 | 130 | 正常 | 异常征兆 |
| 2026-05-10 14:00 | 0.45 | 0.185 | 135 | 正常 | 故障已出现 |
| 2026-05-10 15:00 | 0.45 | 0.180 | 132 | 故障 | 维修时间 |
| 2026-05-10 16:00 | 0.45 | 0.208 | 128 | 正常 | 修复后恢复 |
问题
如果只把 15:00 标为故障,会漏掉 13:00 到 14:00 的早期异常。
建议处理
标签应分为:
正常期
异常征兆期
故障期
维修期
恢复期
而不是简单分成:
正常 / 故障
二十九、故障样本极少
问题说明
调压器大多数时间正常,真实故障很少。
因此数据通常严重不平衡。
模拟样本分布
| 类别 | 样本数量 | 占比 |
|---|---|---|
| 正常 | 990,000 | 99.0% |
| 故障 | 10,000 | 1.0% |
甚至可能是:
| 类别 | 样本数量 | 占比 |
|---|---|---|
| 正常 | 999,000 | 99.9% |
| 故障 | 1,000 | 0.1% |
问题
模型可能全部预测为正常,也能得到很高准确率:
准确率 = 99.9%
但实际没有识别任何故障。
建议处理
评价指标不能只看准确率,应使用:
召回率 Recall
精确率 Precision
F1-score
AUC
PR-AUC
漏报率
误报率
提前预警时间
建模方法可考虑:
异常检测
半监督学习
一类分类 One-Class SVM
孤立森林 Isolation Forest
自编码器 AutoEncoder
代价敏感学习
样本重采样
三十、报警数据和故障数据不一致
问题说明
SCADA 报警不等于真实故障。
报警可能包括:
- 阈值报警;
- 通信报警;
- 设备报警;
- 人工确认报警;
- 瞬时超限报警。
有些报警是误报,有些故障没有报警。
模拟数据样本
| time | P_in | P_out | Q | alarm | 实际情况 |
|---|---|---|---|---|---|
| 2026-05-10 09:00 | 0.45 | 0.210 | 120 | 0 | 正常 |
| 2026-05-10 09:01 | 0.45 | 0.260 | 121 | 1 | 单点尖峰误报 |
| 2026-05-10 09:02 | 0.45 | 0.211 | 120 | 0 | 正常 |
| 2026-05-10 09:03 | 0.45 | 0.188 | 130 | 0 | 实际异常但未报警 |
| 2026-05-10 09:04 | 0.45 | 0.186 | 132 | 0 | 实际异常但未报警 |
建议处理
不要简单把:
alarm = 1
当作故障标签。
应结合:
报警持续时间
报警类型
维修记录
人工确认
压力偏离程度
恢复情况
三十一、数据字段映射错误
问题说明
系统集成时可能出现字段接错。
例如:
- 进口压力字段实际存的是出口压力;
- 流量字段实际存的是累计流量;
- A 调压器数据接到了 B 调压器;
- 单位字段没有同步更新。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 10:00 | 0.210 | 0.450 | 120 | 进口/出口疑似接反 |
| 2026-05-10 10:01 | 0.211 | 0.451 | 125 | 进口/出口疑似接反 |
| 2026-05-10 10:02 | 0.209 | 0.449 | 130 | 进口/出口疑似接反 |
| 2026-05-10 10:03 | 0.210 | 0.450 | 128 | 进口/出口疑似接反 |
判断特征
长期 P_in < P_out
且数值关系稳定
建议处理
这不是设备故障,而是数据系统问题,需要核查点表。
三十二、累计流量误当瞬时流量
问题说明
有些系统中流量字段可能是:
- 瞬时流量;
- 累计流量;
- 日累计量;
- 小时累计量。
如果把累计流量当成瞬时流量,会造成严重错误。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 08:00 | 0.45 | 0.210 | 12000 | 累计流量 |
| 2026-05-10 08:01 | 0.45 | 0.210 | 12120 | 累计流量增加 |
| 2026-05-10 08:02 | 0.45 | 0.209 | 12245 | 累计流量增加 |
| 2026-05-10 08:03 | 0.45 | 0.210 | 12370 | 累计流量增加 |
| 2026-05-10 08:04 | 0.45 | 0.211 | 12490 | 累计流量增加 |
判断特征
Q 单调递增
不会下降
数值远大于正常瞬时流量
正确处理
应转换为瞬时或周期流量:
Q_interval = Q_cumulative(t) - Q_cumulative(t-1)
三十三、累计流量清零 / 翻转
问题说明
累计流量表可能在某些时刻清零,或者达到最大值后翻转。
模拟数据样本
| time | P_in | P_out | Q_cum | 说明 |
|---|---|---|---|---|
| 2026-05-10 23:56 | 0.45 | 0.210 | 99880 | 累计流量 |
| 2026-05-10 23:57 | 0.45 | 0.210 | 99920 | 累计流量 |
| 2026-05-10 23:58 | 0.45 | 0.210 | 99970 | 累计流量 |
| 2026-05-10 23:59 | 0.45 | 0.210 | 100000 | 达到上限 |
| 2026-05-11 00:00 | 0.45 | 0.210 | 20 | 清零或翻转 |
问题
直接计算差分:
20 - 100000 = -99980
会得到一个巨大的负流量。
建议处理
识别清零规则,重新计算周期流量。
三十四、数据噪声过大
问题说明
传感器正常时也会有一定噪声。
如果噪声过大,会影响模型判断。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 15:00 | 0.451 | 0.210 | 120 | 正常 |
| 2026-05-10 15:01 | 0.443 | 0.218 | 118 | 噪声偏大 |
| 2026-05-10 15:02 | 0.459 | 0.203 | 122 | 噪声偏大 |
| 2026-05-10 15:03 | 0.441 | 0.219 | 119 | 噪声偏大 |
| 2026-05-10 15:04 | 0.462 | 0.202 | 121 | 噪声偏大 |
判断特征
高频小幅波动明显
但无明确趋势
建议处理
可使用:
滑动平均
中值滤波
低通滤波
卡尔曼滤波
但注意不要把真实故障早期波动也滤掉。
三十五、数据时间间隔不均匀
问题说明
正常情况下应每 1 分钟或固定周期采样。
但实际数据可能时间间隔不均匀。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 16:00 | 0.45 | 0.210 | 120 | 正常 |
| 2026-05-10 16:01 | 0.45 | 0.211 | 123 | 正常 |
| 2026-05-10 16:07 | 0.46 | 0.209 | 130 | 中间缺 6 分钟 |
| 2026-05-10 16:08 | 0.45 | 0.210 | 128 | 正常 |
| 2026-05-10 16:20 | 0.45 | 0.210 | 125 | 中间缺 12 分钟 |
判断特征
time_diff 不等于固定采样周期
建议处理
统一重采样到固定时间间隔。
三十六、维修期间数据
问题说明
调压器检修、校准、更换部件期间的数据通常不能代表正常运行,也不能简单视为故障。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 09:00 | 0.45 | 0.210 | 120 | 正常 |
| 2026-05-10 09:30 | 0.40 | 0.180 | 60 | 开始检修 |
| 2026-05-10 10:00 | 0.00 | 0.000 | 0 | 设备隔离 |
| 2026-05-10 10:30 | 0.46 | 0.250 | 20 | 调试过程 |
| 2026-05-10 11:00 | 0.45 | 0.210 | 115 | 恢复运行 |
建议处理
结合维修工单,把该区间标记为:
maintenance = 1
一般不作为模型训练的正常或故障样本。
三十七、调压器故障早期征兆数据
问题说明
有些故障不是突然发生,而是逐渐恶化。
例如出口压力恢复越来越慢、波动越来越大、偏离设定值越来越明显。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 08:00 | 0.45 | 0.210 | 120 | 正常 |
| 2026-05-10 09:00 | 0.45 | 0.207 | 130 | 轻微偏低 |
| 2026-05-10 10:00 | 0.45 | 0.202 | 135 | 偏离增大 |
| 2026-05-10 11:00 | 0.45 | 0.196 | 140 | 疑似异常 |
| 2026-05-10 12:00 | 0.45 | 0.188 | 145 | 故障征兆明显 |
建议处理
不要只做“当前时刻分类”,应做趋势建模:
过去 10 分钟均值
过去 30 分钟斜率
过去 1 小时偏离程度
压力恢复时间
三十八、真实调压失效数据
问题说明
调压器失效时,出口压力可能不能稳定在设定值附近。
典型表现包括:
- 出口压力随进口压力变化;
- 出口压力持续偏高;
- 出口压力持续偏低;
- 出口压力波动过大;
- 负荷变化后恢复慢。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 13:00 | 0.42 | 0.198 | 120 | 出口压力偏低 |
| 2026-05-10 13:01 | 0.46 | 0.220 | 122 | 出口随进口升高 |
| 2026-05-10 13:02 | 0.40 | 0.190 | 121 | 出口随进口降低 |
| 2026-05-10 13:03 | 0.47 | 0.226 | 123 | 稳压能力差 |
| 2026-05-10 13:04 | 0.41 | 0.194 | 120 | 持续异常 |
判断特征
P_out 偏离设定值
P_out 与 P_in 高度同步
P_out 波动范围变大
三十九、过滤器堵塞相关数据
问题说明
调压器前过滤器堵塞时,可能导致供气能力下降。
如果没有过滤器前后压差数据,只看进口压力、出口压力、流量,可能表现为:
- 高流量时出口压力偏低;
- 流量上不去;
- 出口压力恢复慢。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 17:00 | 0.45 | 0.210 | 80 | 低负荷正常 |
| 2026-05-10 17:10 | 0.45 | 0.205 | 130 | 负荷升高 |
| 2026-05-10 17:20 | 0.45 | 0.195 | 170 | 出口压力下降 |
| 2026-05-10 17:30 | 0.45 | 0.185 | 190 | 高负荷下偏低 |
| 2026-05-10 17:40 | 0.45 | 0.184 | 190 | 流量难以上升 |
建议处理
如果条件允许,应增加:
过滤器前压力
过滤器后压力
过滤器压差
否则容易和调压器本体故障混淆。
四十、下游泄漏或异常耗气
问题说明
如果下游发生泄漏或异常耗气,流量会异常升高,出口压力可能下降。
这不是调压器本体故障,但会影响调压器数据。
模拟数据样本
| time | P_in | P_out | Q | 说明 |
|---|---|---|---|---|
| 2026-05-10 01:00 | 0.45 | 0.211 | 20 | 夜间正常低流量 |
| 2026-05-10 01:10 | 0.45 | 0.209 | 22 | 正常 |
| 2026-05-10 01:20 | 0.45 | 0.205 | 90 | 夜间异常流量 |
| 2026-05-10 01:30 | 0.45 | 0.203 | 95 | 持续异常 |
| 2026-05-10 01:40 | 0.45 | 0.204 | 93 | 疑似泄漏或异常耗气 |
判断特征
在本应低负荷时段 Q 异常升高
P_out 可能轻微下降
建议处理
这类数据应作为“下游异常”标记,不应简单归为调压器故障。
四十一、最终汇总表
| 编号 | 数据问题 | 典型表现 | 是否可直接用于故障建模 |
|---|---|---|---|
| 1 | 调压器未使用 | Q≈0,压力稳定 | 否,需标记停用 |
| 2 | 低负荷 | Q 很小,压力正常 | 可用,但需分工况 |
| 3 | 缺失值 | NULL、空值 | 需补全或删除 |
| 4 | 重复时间戳 | 同一时间多条记录 | 需去重 |
| 5 | 异常尖峰 | 单点极大值 | 通常需剔除 |
| 6 | 瞬时掉零 | 单点变 0 | 通常为采集异常 |
| 7 | 数据冻结 | 长时间不变 | 传感器/通信异常 |
| 8 | 传感器漂移 | 缓慢偏离 | 需趋势识别 |
| 9 | 负值异常 | 压力或流量为负 | 需剔除或核查 |
| 10 | 出口大于进口 | P_out > P_in | 物理异常 |
| 11 | 单位不一致 | 数值突然放大 | 需统一单位 |
| 12 | 采样频率不一致 | 字段更新时间不同 | 需重采样 |
| 13 | 时间不同步 | 压力流量错位 | 需时间对齐 |
| 14 | 启停过程 | Q 从 0 突变 | 单独标记 |
| 15 | 主备切换 | 流量突变、压力变化 | 需结合阀门状态 |
| 16 | 上游扰动 | P_in 大幅波动 | 不一定是故障 |
| 17 | 下游用气突增 | Q 升高、P_out 短降 | 可能是正常工况 |
| 18 | 出口长期偏低 | P_out 持续低于设定 | 故障候选 |
| 19 | 出口长期偏高 | P_out 持续高于设定 | 高风险故障候选 |
| 20 | 出口压力振荡 | P_out 高频波动 | 故障候选 |
| 21 | 进口出口同步波动 | P_out 随 P_in 波动 | 调压能力下降候选 |
| 22 | 标签不准确 | 维修时间不等于故障时间 | 需重新标注 |
| 23 | 样本不平衡 | 故障样本极少 | 需特殊建模 |
| 24 | 报警与故障不一致 | 报警可能误报漏报 | 不能直接当标签 |
| 25 | 字段映射错误 | 点位接反 | 需核查点表 |
| 26 | 累计流量误用 | Q 单调递增 | 需差分转换 |
| 27 | 维修期间数据 | 检修、校准、调试 | 单独剔除或标记 |
| 28 | 下游泄漏 | 夜间 Q 异常升高 | 下游异常,不是调压器本体故障 |
四十二、建议建立的数据清洗标签体系
建模前可以给每条数据增加一个 data_status 字段。
| data_status | 含义 |
|---|---|
| normal_operation | 正常运行 |
| low_load | 低负荷 |
| shutdown | 停用 |
| startup | 启动过程 |
| switching | 主备切换 |
| maintenance | 检修维护 |
| missing | 数据缺失 |
| spike | 尖峰异常 |
| zero_drop | 瞬时掉零 |
| frozen | 数据冻结 |
| drift | 传感器漂移 |
| physical_error | 物理逻辑错误 |
| upstream_disturbance | 上游扰动 |
| downstream_disturbance | 下游扰动 |
| suspected_fault | 疑似故障 |
| confirmed_fault | 确认故障 |
四十三、推荐建模前的数据处理流程
SCADA 原始数据
↓
统一字段名称、单位、时间格式
↓
去重、排序、检查采样间隔
↓
缺失值识别与处理
↓
尖峰、掉零、负值、越界检测
↓
传感器卡死、漂移检测
↓
物理规则校验:
P_in > P_out
P_out 接近设定值
流量变化与压力响应匹配
↓
识别停用、低负荷、启停、切换、维修状态
↓
识别上游扰动、下游扰动
↓
构造特征:
压差 = P_in - P_out
出口压力偏差 = P_out - P_out_set
流量变化率
压力变化率
压力波动幅度
滞后特征
恢复时间
↓
结合报警、维修、巡检记录重新构造标签
↓
建立故障识别 / 异常检测 / 预警模型
四十四、最核心的建模提醒
建立燃气调压器故障模型时,不能把所有异常数据都当成故障。
应该区分四类情况:
| 类型 | 示例 |
|---|---|
| 真实故障 | 调压失效、出口压力持续偏高、出口压力持续偏低 |
| 正常工况变化 | 低负荷、早晚高峰、启停、主备切换 |
| 数据采集异常 | 缺失、尖峰、卡死、漂移、单位错误 |
| 外部系统扰动 | 上游压力波动、下游突增用气、下游泄漏 |
一句话总结:
SCADA 原始数据中的“异常”不一定是调压器故障,建模前必须先做数据状态识别、物理规则校验和故障标签修正,否则模型学到的不是故障规律,而是采集噪声、工况变化和错误标签。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)