当神经网络判断故障时，依据在哪里？——基于梯度加权的时序决策可视化和误诊回溯

哥廷根数学学派2023

441人浏览 · 2026-05-27 10:00:00

哥廷根数学学派2023 · 2026-05-27 10:00:00 发布

一维卷积网络在时序分类中精度突出，但一个根本问题始终存在：模型输出故障标签时，它在输入序列的哪一段找到了支撑？是抓住了真实的异常脉冲，还是被数据中的伪迹所误导？采用一种基于梯度反向传播的后验解释方法，在不修改网络结构、不重新训练的前提下，生成与输入时间轴一一对应的重要性序列，以色谱的方式直接叠加在原始波形上。实验用模拟的多通道传感器故障数据进行了验证。

01 问题动机：高精度分类不等于可信决策

在许多工业与科学应用中，基于深度学习的时序分类器已经能达到令人满意的准确率。然而当系统自动给出传感器故障这个结论时，维护人员往往希望知道是哪些时间步的特征让模型做出了这个决定？ 如果答案仅仅是一个数字化的概率值，那么即使准确率很高，也难以获得信任。

传统理解网络决策的方法，是分析卷积核形态或逐层激活统计。但是在多层非线性映射之后，输入和输出的联系变的极为间接，很难将某一类的判别依据还原到原始时间轴的特定位置。如果有一种手段，能够对任意已经训练好的模型进行事后诊断——针对每一个输入样本，输出一张与它同等长度的重要性曲线，直接标示出模型所倚重的时段，那么工程师就能够用领域知识去检验这些时段的物理合理性。

这正是梯度加权类激活映射在时序场景中的价值：它利用网络末层卷积特征对类别得分的梯度，反推出每个时间步对分类结果的贡献大小，从而生成一份可读的决策依据图。

02 方法原理：用梯度构建时间重要性映射

核心思想是，卷积网络的末层仍然保留了完整的时间结构——每一个特征通道的长度和输入序列相同，只是语义层次更高。如果我们想知道哪些时间步对某一类得分的影响最大，可以求出该得分相对于末层特征图的梯度。这个梯度告诉我们：如果在某一时间步略微增强某个特征通道，分类得分会如何变化。

实际操作分为三步：

获取末层特征与梯度：将一个待解释的样本前向传播，记录最后一个卷积层的输出特征图。然后以目标类别（例如“传感器故障”）的得分作为起点反向传播，得到特征图每个位置、每个通道的梯度。
确定通道重要性权重：将每个通道的梯度在时间维上取全局平均，得到一个标量，这个标量反映了该通道整体对目标类得分的贡献程度。
合成一维重要性序列：用这些通道权重对特征图做线性组合，并保留正向贡献部分，得到一条与原始输入长度相同的时间序列。数值越大的位置，就是模型认为对支持该类别越关键的时间步。

把这个重要性序列映射为颜色，直接绘制在原始波形上，就能生成一幅直观的解释图：红色或黄色越深，表示模型越是依赖该段信号做出当前判断。提出方法属于后验解释，完全独立于训练过程。任何采用全局平均池化和卷积结构的网络，只要能够进行梯度反向传播，就可以直接应用，不需要修改架构或重新训练。

03 实验设计：已知故障位置下的解释可信度测试

为了客观评估解释结果的准确性，构造了一个标注明确的合成数据集。原始数据由三通道、变长度的波形序列组成，在其中随机选取十分之一的序列，在每个序列的随机位置注入一段持续 4 至 20 个时间步的局部脉冲，幅值在 0.25 到 2 之间，用来模拟传感器瞬间异常。被注入脉冲的序列标记为传感器故障，其余标记为正常。

分类网络由两个一维卷积块堆叠而成，每个块包含因果卷积、ReLU 激活和层归一化，滤波器数量依次为 32 和 64，卷积核大小为 3。卷积特征经全局平均池化后，通过全连接和 softmax 输出2类概率。训练采用交叉熵损失和 Adam 优化器，最大 15 轮，小批量大小为 27，变长序列通过左填充对齐。

04 解释结果：正确分类和误分类的对比透视

我们分别对验证集中被正确识别为故障的样本和被误判为正常的故障样本生成了重要性序列图。每张图中，原始波形以彩色方式绘制，颜色深浅代表梯度加权后的重要性，同时用垂直虚线标出注入脉冲的真实区间。

在正确分类的样本上，重要性热图的突出区域高度集中于虚线所夹的异常脉冲段。三个通道上的深浅变化几乎同步，脉冲区间之外的部分色彩均偏深蓝，表示模型几乎未予关注。这说明网络在判断故障时，确实主要依赖了那段人为注入的异常信号，而不是波形中其他偶然的起伏或背景噪声。

在错误分类的样本上，情况有明显差异。虽然重要性图也在真实故障区间内出现了暖色，但覆盖范围远小于实际脉冲段的长度。模型似乎只对异常脉冲的一小部分产生了响应，其余部分的关注度不足。网络虽然看到了一些异常迹象，但是没有捕捉到整个故障形态，导致最终的类别倾向偏向正常。这种信息本身极具诊断价值——它告诉研究者，对于这类幅度较小或长度较短的故障，当前模型的证据积累尚不充分，可能需要在训练中增加类似样本或调整网络结构。