DOA-CNN-GRU分类预测+SHAP分析+特征依赖图！深度学习可解释分析，Matlab代码实现

@橘柑橙柠桔柚

48人浏览 · 2026-03-23 07:02:14

@橘柑橙柠桔柚 · 2026-03-23 07:02:14 发布

💥💥💞💞欢迎来到本博客❤️❤️💥💥

🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。

⛳️座右铭：行百里者，半于九十。

📋📋📋本文内容如下：🎁🎁🎁

⛳️赠与读者

👨‍💻做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创新点和启发点。建议读者按目录次序逐一浏览，免得骤然跌入幽暗的迷宫找不到来时的路，它不足为你揭示全部问题的答案，但若能解答你胸中升起的一朵朵疑云，也未尝不会酿成晚霞斑斓的别一番景致，万一它给你带来了一场精神世界的苦雨，那就借机洗刷一下原来存放在那儿的“躺平”上的尘埃吧。

或许，雨过云收，神驰的天地更清朗.......🔎🔎🔎

💥第一部分——内容介绍

基于DOA优化CNN-GRU的分类预测模型及SHAP可解释性分析

摘要

深度学习技术在分类预测任务中展现出卓越的性能，但其“黑箱”特性导致模型决策过程难以解释，限制了其在高风险领域的应用。针对这一问题，本文提出一种基于梦境优化算法（DOA）优化卷积神经网络-门控循环单元（CNN-GRU）的分类预测模型，并结合SHAP（SHapley Additive exPlanations）可解释性方法与特征依赖图，构建一套完整的深度学习可解释性分析框架。首先，利用DOA算法自动寻优CNN-GRU模型的关键超参数，解决传统超参数手动调整效率低、泛化能力差的问题；其次，搭建CNN-GRU混合网络，充分发挥CNN提取局部空间特征与GRU捕捉时间序列依赖的优势，提升分类预测精度；最后，通过SHAP分析量化各输入特征对模型预测结果的边际贡献，结合特征依赖图直观展示特征与预测结果之间的非线性关系，破解深度学习模型的可解释性难题。实验以多领域序列或时空特征数据集为研究对象，验证所提模型的分类性能与可解释性效果。结果表明，DOA优化后的CNN-GRU模型在分类准确率上显著优于传统CNN、GRU及未优化的CNN-GRU模型；SHAP分析能够清晰识别影响模型预测的核心特征，特征依赖图可直观呈现不同特征取值对预测结果的正负向影响规律。本文研究不仅提升了深度学习模型在分类预测任务中的性能与稳定性，还通过可解释性分析增强了模型的可信度与实用性，为深度学习模型在工业故障诊断、医疗信号处理、金融风控等领域的落地应用提供了理论支撑与实践参考。

关键词：DOA算法；CNN-GRU模型；分类预测；SHAP分析；特征依赖图；可解释性深度学习

1 引言

1.1 研究背景

随着人工智能技术的飞速发展，深度学习已成为分类预测任务的核心技术之一，广泛应用于工业设备故障诊断、医疗信号分类、金融时间序列预测、传感器数据模式识别等多个领域。卷积神经网络（CNN）凭借其强大的局部特征提取能力，能够有效捕捉数据中的空间关联信息；门控循环单元（GRU）作为循环神经网络（RNN）的重要变体，通过门控机制有效缓解了长序列数据处理中的梯度消失问题，擅长捕捉数据中的时间动态依赖关系。将CNN与GRU结合构建的混合神经网络，能够同时处理具有空间结构和时间序列特性的数据，在多特征分类预测任务中展现出独特的优势。

然而，传统CNN-GRU模型的超参数（如初始学习率、GRU层隐藏节点数、L2正则化系数等）通常依赖人工经验手动调整，存在调整效率低、超参数组合非最优的问题，导致模型的泛化能力和分类精度受到限制。梦境优化算法（DOA）作为一种新型群体智能优化算法，模拟人类梦境中的随机想象、记忆重构等机制，通过种群迭代更新实现最优解的高效搜索，为深度学习模型的超参数优化提供了一种高效、自适应的解决方案。

与此同时，深度学习模型的“黑箱”特性日益凸显，成为制约其在高风险领域应用的关键瓶颈。在医疗诊断、金融风控等场景中，仅获得模型的预测结果远远不够，还需要明确模型做出该预测的依据的逻辑，即模型的可解释性。可解释人工智能（XAI）技术的兴起为解决这一问题提供了思路，其中SHAP方法基于博弈论中的Shapley值，能够量化每个输入特征对模型预测结果的边际贡献，具有数学严谨性、模型无关性等优势，已成为深度学习可解释性分析的主流工具。特征依赖图作为SHAP分析的重要补充，能够直观展示单个特征取值与模型预测结果之间的非线性关系，进一步揭示特征对预测决策的影响规律。

因此，将DOA超参数优化、CNN-GRU分类预测与SHAP可解释性分析相结合，构建一套高效、可解释的深度学习分类预测框架，不仅能够提升模型的分类性能，还能破解“黑箱”难题，增强模型的可信度与可应用性，具有重要的理论研究价值和实际应用意义。

1.2 研究意义

1.2.1 理论意义

本文的理论意义主要体现在三个方面：一是提出DOA优化CNN-GRU的混合模型架构，丰富了深度学习模型超参数优化的研究思路，验证了DOA算法在深度学习超参数寻优中的有效性，为同类模型的超参数优化提供了新的方法参考；二是构建了“模型优化-分类预测-可解释性分析”的一体化框架，将分类性能提升与可解释性分析有机结合，弥补了传统深度学习模型重性能、轻解释的不足，完善了可解释性深度学习的研究体系；三是通过SHAP分析与特征依赖图的结合应用，深化了对CNN-GRU混合模型决策机制的理解，为复杂深度学习模型的可解释性研究提供了新的视角和技术路径。

1.2.2 实践意义

本文的实践意义主要体现在实际应用场景的落地价值：一是所提DOA-CNN-GRU模型能够自动优化超参数，降低人工调参成本，提升分类预测的精度和稳定性，可直接应用于工业故障诊断、医疗信号处理、金融时间序列分类等多个领域，为实际业务中的分类问题提供高效解决方案；二是SHAP可解释性分析与特征依赖图能够清晰揭示模型的决策逻辑，帮助领域专家理解特征与预测结果之间的关联，例如在医疗领域可辅助医生解读诊断依据，在金融领域可满足监管机构对模型可解释性的要求；三是模型的可解释性能够增强用户对深度学习模型的信任，推动深度学习技术在高风险、高要求领域的广泛落地，促进人工智能技术与实际产业的深度融合。

1.3 国内外研究现状

1.3.1 深度学习分类预测模型研究现状

近年来，CNN与GRU的混合模型在分类预测任务中得到了广泛研究与应用。研究者们通过不同的网络结构设计，充分发挥两者的优势，提升模型性能。例如，在图像序列分类任务中，研究者利用CNN提取每帧图像的空间特征，再通过GRU处理序列信息，有效捕捉图像序列中的时空关联；在传感器数据分类中，CNN用于提取传感器数据的局部特征，GRU用于处理数据的时间序列依赖，显著提升了分类准确率。然而，传统CNN-GRU模型的超参数调整依赖人工经验，存在寻优效率低、泛化能力不足的问题，限制了模型的性能发挥。

为解决超参数优化问题，各类智能优化算法被广泛应用于深度学习模型中，如遗传算法、粒子群优化算法、鲸鱼优化算法等。这些算法通过模拟自然生物或物理现象的规律，实现超参数的自动寻优，在一定程度上提升了模型性能。但部分优化算法存在收敛速度慢、易陷入局部最优的缺陷，而DOA算法作为一种新型群体智能优化算法，具有收敛速度快、寻优精度高、自适应能力强等优势，在函数优化、参数寻优等领域展现出良好的性能，但将其应用于CNN-GRU模型超参数优化的研究仍较为匮乏，存在较大的研究空间。

1.3.2 深度学习可解释性研究现状

随着深度学习模型复杂度的提升，可解释性研究成为人工智能领域的研究热点。目前，可解释性方法主要分为内在可解释模型和事后解释方法两大类。内在可解释模型（如决策树、线性回归）结构简单、解释直观，但性能有限，难以满足复杂分类任务的需求；事后解释方法则针对复杂深度学习模型，通过分析模型的输入与输出关系，构建解释界面，其中SHAP、LIME等方法应用最为广泛。

SHAP方法基于Shapley值理论，能够为每个特征分配一个量化的贡献值，直观反映特征对预测结果的影响，具有全局与局部解释相结合的优势。目前，SHAP方法已被应用于CNN、LSTM、Transformer等多种深度学习模型的可解释性分析中，在图像识别、自然语言处理、医疗诊断等领域取得了一定的研究成果。但现有研究多集中于单一模型的SHAP分析，将SHAP分析与特征依赖图结合，应用于DOA优化后的CNN-GRU混合模型的研究较为少见，且缺乏对模型决策机制的系统分析，难以全面揭示特征与预测结果之间的复杂关系。

1.3.3 研究现状总结

综合来看，当前深度学习分类预测模型的研究已取得显著进展，但仍存在两个关键问题：一是传统CNN-GRU模型的超参数优化效率低、泛化能力不足，DOA算法在该领域的应用有待进一步探索；二是深度学习模型的可解释性不足，SHAP分析与特征依赖图的结合应用不够深入，难以全面揭示模型的决策逻辑。本文针对上述问题，提出DOA优化CNN-GRU分类预测模型，并结合SHAP分析与特征依赖图开展可解释性研究，弥补现有研究的不足。

1.4 研究内容与技术路线

1.4.1 研究内容

本文围绕DOA-CNN-GRU分类预测模型的构建、优化及可解释性分析展开，具体研究内容如下：

（1）数据预处理与数据集构建：针对具体分类任务，收集相关数据集，进行数据清洗、归一化、分层抽样划分训练集与测试集等预处理操作，将数据重塑为适合CNN-GRU模型输入的格式，为模型训练与测试提供高质量的数据支撑。

（2）DOA优化CNN-GRU模型构建：搭建CNN-GRU混合网络架构，确定需要优化的关键超参数（初始学习率、GRU层隐藏节点数、L2正则化系数），利用DOA算法进行超参数寻优，确定最优超参数组合，构建DOA-CNN-GRU分类预测模型。

（3）模型训练与性能评估：利用预处理后的数据集训练DOA-CNN-GRU模型，设置合理的训练参数，通过混淆矩阵、分类准确率等指标，将所提模型与传统CNN、GRU、未优化的CNN-GRU模型进行对比，验证模型的分类性能优势。

（4）SHAP可解释性分析：基于测试集样本计算SHAP值，通过SHAP摘要图、特征重要性条形图，量化各特征对模型预测结果的贡献度，识别影响模型预测的核心特征；结合特征依赖图，分析单个特征取值与预测结果之间的非线性关系，揭示模型的决策逻辑。

（5）模型稳定性与可解释性验证：通过多次重复实验验证DOA-CNN-GRU模型的稳定性，结合领域知识分析SHAP分析结果与特征依赖图的合理性，进一步验证可解释性分析的有效性。

1.4.2 技术路线

本文的技术路线遵循“数据预处理→超参数优化→模型构建与训练→性能评估→可解释性分析→结论与展望”的逻辑展开，具体流程如下：首先，对原始数据进行清洗、归一化、划分数据集等预处理操作，为模型训练做准备；其次，利用DOA算法优化CNN-GRU模型的关键超参数，确定最优超参数组合；然后，搭建DOA-CNN-GRU分类预测模型，利用训练集进行模型训练，通过测试集评估模型性能；接着，采用SHAP方法计算特征的SHAP值，绘制SHAP摘要图、特征重要性条形图及特征依赖图，开展可解释性分析；最后，总结研究成果，分析研究存在的不足，并对未来研究方向进行展望。整个技术路线形成了一套完整的“模型优化-性能验证-可解释性分析”一体化框架，确保研究的系统性与完整性。

1.5 研究创新点

本文的创新点主要体现在以下三个方面：

（1）提出将DOA算法应用于CNN-GRU模型的超参数优化，解决传统人工调参效率低、超参数组合非最优的问题，充分发挥DOA算法收敛速度快、寻优精度高的优势，提升模型的分类精度与泛化能力。

（2）构建“DOA优化+CNN-GRU分类+SHAP可解释性分析”的一体化框架，将模型性能提升与可解释性分析有机结合，打破了传统深度学习模型“重性能、轻解释”的局限，实现了分类预测与决策解释的双重目标。

（3）将SHAP分析与特征依赖图深度结合，不仅量化了特征对预测结果的贡献度，还直观呈现了特征取值与预测结果之间的非线性关系，全面揭示了CNN-GRU混合模型的决策机制，提升了模型的可解释性与可信度。

2 相关理论基础

2.1 卷积神经网络（CNN）

卷积神经网络是一种专门用于处理具有网格结构数据的深度学习模型，其核心优势在于能够通过卷积操作自动提取数据中的局部空间特征，减少参数数量，提升模型的训练效率与泛化能力。CNN的基本结构主要包括输入层、卷积层、激活层、池化层和全连接层。

输入层负责接收原始数据，将其转换为模型可处理的格式；卷积层通过卷积核与输入数据进行卷积操作，提取数据的局部特征，不同的卷积核可提取不同类型的特征，通过多层卷积操作可实现从低级特征到高级特征的逐步提取；激活层用于引入非线性因素，缓解梯度消失问题，常用的激活函数为ReLU函数，能够有效提升模型的非线性拟合能力；池化层用于对卷积层提取的特征进行降维处理，保留关键特征，减少计算量，常用的池化方式包括最大池化和平均池化；全连接层将池化层输出的特征向量映射到目标类别空间，实现分类预测。

在本文的分类任务中，CNN主要用于提取输入数据中的局部空间关联特征，为后续GRU层的时间序列建模提供高质量的特征输入，充分发挥其局部特征提取的优势。

2.2 门控循环单元（GRU）

门控循环单元是RNN的一种改进形式，主要用于处理时间序列数据，解决了传统RNN在处理长序列数据时出现的梯度消失或梯度爆炸问题。GRU通过引入更新门和重置门两个门控机制，实现对序列信息的选择性记忆与遗忘，能够有效捕捉时间序列数据中的长期依赖关系。

更新门用于控制前一时刻的隐藏状态对当前时刻隐藏状态的影响程度，决定了哪些信息需要保留、哪些信息需要更新；重置门用于控制前一时刻隐藏状态的遗忘程度，决定了是否需要忽略前一时刻的部分信息。通过两个门控机制的协同作用，GRU能够自适应地调整隐藏状态，有效捕捉时间序列中的动态变化特征。

在本文的混合模型中，GRU层接收CNN层提取的特征序列，对其进行时间序列建模，捕捉特征之间的时间依赖关系，将空间特征与时间特征有机结合，提升模型的分类预测精度，尤其适用于具有序列特性的分类任务。

2.3 梦境优化算法（DOA）

梦境优化算法是一种新型群体智能优化算法，模拟人类梦境中的随机想象、记忆重构、遗忘机制等生理过程，通过种群迭代更新实现最优解的高效搜索。与传统智能优化算法相比，DOA算法具有收敛速度快、寻优精度高、参数设置简单、自适应能力强等优势，无需复杂的参数调整，即可适应不同类型的优化问题。

DOA算法的核心思想是将种群中的每个个体视为一个“梦境个体”，通过模拟梦境的产生、记忆、遗忘等过程，实现个体位置的更新与优化。算法的基本流程包括初始化种群、梦境产生、记忆重构、遗忘操作、种群更新等步骤：首先，初始化种群，随机生成一定数量的个体，每个个体对应一组超参数组合；其次，通过梦境产生操作生成新的个体，模拟梦境中的随机想象过程；然后，通过记忆重构操作保留优质个体，模拟人类对重要信息的记忆过程；接着，通过遗忘操作淘汰劣质个体，模拟人类对无关信息的遗忘过程；最后，重复上述步骤，直至达到预设的迭代次数，输出最优个体，即最优超参数组合。

本文利用DOA算法优化CNN-GRU模型的关键超参数，充分发挥其寻优效率高、自适应能力强的优势，解决传统人工调参的不足，提升模型的分类性能。

2.4 SHAP可解释性分析方法

SHAP方法是一种基于博弈论中Shapley值的可解释性分析方法，由Lundberg和Lee于2017年首次提出，其核心思想是将模型的预测结果视为所有输入特征共同作用的“总收益”，每个特征对预测结果的贡献度（即SHAP值）通过Shapley值计算得出，能够量化每个特征对预测结果的正负向影响。

SHAP方法具有三个核心优势：一是数学严谨性，满足加性特征归因的三大公理（局部准确性、缺失性、一致性），确保解释结果的可靠性；二是模型无关性，适用于各类深度学习模型和机器学习模型，无需对模型结构进行修改；三是全局与局部结合，既可以通过聚合所有样本的SHAP值分析模型的全局决策规律，也可以通过单个样本的SHAP值解释具体预测结果的决策依据。

SHAP分析的常用可视化工具包括SHAP摘要图、特征重要性条形图、力导图等。其中，SHAP摘要图能够展示所有样本中各特征的SHAP值分布，直观反映特征对预测结果的正负向影响；特征重要性条形图通过计算各特征的平均绝对SHAP值，排序展示特征的重要程度，识别核心影响特征；力导图用于解释单个样本的预测过程，展示每个特征对该样本预测结果的具体贡献。

2.5 特征依赖图

特征依赖图是一种用于展示单个特征与模型预测结果之间关系的可视化工具，是SHAP可解释性分析的重要补充。其核心作用是直观呈现特征取值的变化对模型预测结果的影响趋势，揭示特征与预测结果之间的非线性关系。

特征依赖图的横轴为特征的取值，纵轴为该特征的SHAP值，SHAP值为正表示该特征取值对预测结果有正向贡献，SHAP值为负表示有负向贡献，SHAP值为零表示无影响。通过特征依赖图，可以清晰观察到特征在不同取值范围内对预测结果的影响程度和变化规律，例如某些特征在取值较低时对预测结果有正向影响，在取值较高时则变为负向影响，这种非线性关系是传统线性分析方法难以捕捉的。

在本文的可解释性分析中，特征依赖图用于补充SHAP值的量化分析，将抽象的特征贡献值转化为直观的变化趋势，帮助领域专家更好地理解特征与预测结果之间的复杂关联，进一步揭示模型的决策逻辑。

3 DOA-CNN-GRU分类预测模型构建

3.1 模型整体架构设计

本文提出的DOA-CNN-GRU分类预测模型，整体架构分为三个部分：数据预处理模块、DOA超参数优化模块、CNN-GRU分类预测模块，三者协同工作，实现高效、准确的分类预测。模型的整体设计思路是：首先通过数据预处理模块对原始数据进行处理，得到适合模型输入的标准化数据；然后通过DOA超参数优化模块，寻优CNN-GRU模型的关键超参数，确定最优超参数组合；最后利用优化后的CNN-GRU模型对预处理后的数据进行分类预测，输出分类结果。

模型的整体架构具有以下特点：一是将DOA超参数优化与CNN-GRU混合模型有机结合，解决了传统模型超参数手动调整的缺陷，提升了模型的泛化能力和分类精度；二是充分发挥CNN的局部特征提取能力和GRU的时间序列建模能力，能够同时处理具有空间结构和时间序列特性的数据，适用于多领域分类任务；三是模型结构简洁、可扩展性强，可根据不同的分类任务需求，调整网络层数、超参数搜索范围等，具有较强的适应性。

3.2 数据预处理模块设计

数据预处理是深度学习模型训练的基础，直接影响模型的训练效果和分类性能。本文针对分类任务的特点，设计了一套完整的数据预处理流程，主要包括数据清洗、数据归一化、数据集划分和数据格式转换四个步骤。

（1）数据清洗：原始数据中可能存在缺失值、异常值、重复数据等问题，这些问题会影响模型的训练效果，因此需要进行数据清洗。对于缺失值，根据数据的分布特点，采用均值填充、中位数填充或线性插值的方式进行补充；对于异常值，采用箱线图法识别异常数据，结合领域知识判断是否保留或修正；对于重复数据，直接删除重复样本，确保数据的唯一性。

（2）数据归一化：由于不同特征的取值范围差异较大，会导致模型训练过程中出现梯度下降缓慢、收敛困难等问题，因此需要对数据进行归一化处理。本文采用Min-Max归一化方法，将所有特征的取值映射到[0,1]区间，消除特征取值范围差异带来的影响，使模型能够更高效地学习特征之间的关联关系。

（3）数据集划分：为了验证模型的泛化能力，将预处理后的数据集按照7:3的比例，采用分层抽样的方式划分为训练集和测试集。其中，训练集用于模型的训练和超参数优化，测试集用于模型的性能评估，分层抽样能够确保训练集和测试集中各类别的样本比例一致，避免因样本分布不均导致的模型过拟合或欠拟合。

（4）数据格式转换：CNN模型需要输入具有网格结构的数据，而原始数据通常为一维序列数据，因此需要对数据进行格式转换。通过reshape操作将一维特征转换为适合CNN输入的四维张量格式，并利用序列折叠层对序列数据进行处理，使数据能够同时适应CNN的空间特征提取和GRU的时间序列建模需求。

3.3 DOA超参数优化模块设计

3.3.1 优化目标与超参数选择

DOA超参数优化的核心目标是寻找最优的CNN-GRU模型超参数组合，使模型在分类任务中的分类准确率最高、泛化能力最强。结合CNN-GRU模型的结构特点和训练规律，本文选择对模型性能影响最大的三个关键超参数作为优化对象，分别是初始学习率、GRU层隐藏节点数、L2正则化系数。

初始学习率决定了模型训练过程中参数更新的步长，学习率过大容易导致模型训练震荡、不收敛，学习率过小则会导致模型训练速度缓慢、收敛困难；GRU层隐藏节点数决定了模型捕捉时间序列依赖的能力，节点数过多会导致模型复杂度增加、过拟合，节点数过少则会导致模型拟合能力不足；L2正则化系数用于防止模型过拟合，系数过大容易导致模型欠拟合，系数过小则无法有效抑制过拟合。

3.3.2 DOA优化流程设计

本文设计的DOA超参数优化流程主要包括以下步骤：

（1）初始化种群：设置DOA算法的种群规模、最大迭代次数、优化维度等参数，其中优化维度为3（对应三个关键超参数）。随机生成一定数量的个体，每个个体对应一组超参数组合，根据超参数的物理意义，设定每个超参数的搜索范围：初始学习率为1e-3~1e-2，GRU层隐藏节点数为10~30（整数），L2正则化系数为1e-4~1e-1。

（2）适应度函数定义：将CNN-GRU模型的分类误差作为DOA算法的适应度函数，适应度值越小，表明超参数组合越优。适应度函数的计算过程为：将当前个体对应的超参数组合代入CNN-GRU模型，利用训练集进行模型训练，计算模型在验证集上的分类误差，作为该个体的适应度值。

（3）梦境产生与个体更新：模拟梦境的随机想象过程，通过随机扰动、个体记忆等操作生成新的个体，新个体的生成结合了当前最优个体的信息和随机扰动，确保算法的探索能力和收敛速度。

（4）记忆重构与遗忘操作：模拟人类的记忆与遗忘机制，保留适应度值较小的优质个体，淘汰适应度值较大的劣质个体，确保种群的整体质量，避免算法陷入局部最优。

（5）终止条件判断：判断是否达到预设的最大迭代次数，若达到，则输出当前种群中的最优个体，即最优超参数组合；若未达到，则返回步骤（3），继续进行种群迭代更新。

3.4 CNN-GRU分类预测模块设计

CNN-GRU分类预测模块是模型的核心部分，负责特征提取与分类预测，其结构设计充分结合了CNN和GRU的优势，具体结构从输入到输出依次为：序列输入层、序列折叠层、卷积层、激活层、序列展开层、扁平层、GRU层、全连接层、softmax层、分类层。

（1）序列输入层：接收预处理后的四维张量数据，作为模型的输入，输入数据的维度根据数据集的特征数量和序列长度确定。

（2）序列折叠层：将一维序列数据折叠为适合卷积操作的二维特征图，实现序列数据向空间特征的转换，为CNN层的局部特征提取做准备。

（3）卷积层：采用多层卷积核进行卷积操作，提取输入数据中的局部空间特征，每层卷积层设置多个不同尺寸的卷积核，以捕捉不同类型的局部特征，提升特征提取的全面性。

（4）激活层：采用ReLU激活函数，引入非线性因素，缓解梯度消失问题，增强模型的非线性拟合能力，使模型能够学习到更复杂的特征关联。

（5）序列展开层：将卷积层输出的二维特征图展开为一维特征序列，为GRU层的时间序列建模提供输入，实现空间特征向时间序列特征的转换。

（6）扁平层：将序列展开层输出的特征序列转换为特征向量，消除维度差异，为GRU层的输入做准备。

（7）GRU层：接收扁平层输出的特征向量，通过更新门和重置门控制信息的流动，捕捉特征序列中的时间依赖关系，输出包含时间特征的隐藏状态向量。

（8）全连接层：将GRU层输出的隐藏状态向量映射到高维特征空间，进一步整合特征信息，提升模型的分类能力。

（9）softmax层：将全连接层输出的特征向量转换为各类别的概率分布，概率值最大的类别即为模型的预测类别。

（10）分类层：根据softmax层输出的概率分布，输出最终的分类结果，完成分类预测任务。

4 实验设计与性能评估

4.1 实验环境与数据集

4.1.1 实验环境

本次实验采用MATLAB R2020及以上版本作为实验平台，硬件环境为：CPU为Intel Core i7-10750H，内存为16GB，显卡为NVIDIA GeForce GTX 1650，操作系统为Windows 10 64位。实验过程中，模型训练采用Adam优化器，设置最大训练迭代次数为500，学习率下降因子为0.1，下降周期为400，训练过程可视化，便于观察模型的训练过程与收敛情况。

4.1.2 实验数据集

本次实验选取多领域典型数据集作为研究对象，涵盖工业故障诊断、医疗信号处理两个典型应用场景，验证模型的通用性和有效性。

（1）工业故障诊断数据集：选取某工厂机械设备振动信号数据集，该数据集包含正常运行、轴承磨损、齿轮故障三种状态的振动信号，共1000个样本，每个样本包含12个特征，分别对应振动信号的时域、频域特征，其中700个样本作为训练集，300个样本作为测试集。该数据集具有明显的序列特性，适合CNN-GRU模型的处理。

（2）医疗信号处理数据集：选取心电图（ECG）分类数据集，该数据集包含正常心电图、心律失常、心肌缺血三种类型的ECG信号，共800个样本，每个样本包含10个特征，对应ECG信号的特征参数，按7:3的比例划分为训练集（560个样本）和测试集（240个样本）。该数据集具有时空特征，能够有效验证模型的特征提取与分类能力。

4.2 实验设计

4.2.1 实验对照组设置

为验证DOA-CNN-GRU模型的分类性能优势，设置以下4组对照实验：

（1）对照组1：传统CNN模型，超参数采用人工经验设置，结构包括输入层、卷积层、激活层、池化层、全连接层、分类层。

（2）对照组2：传统GRU模型，超参数采用人工经验设置，结构包括输入层、GRU层、全连接层、分类层。

（3）对照组3：未优化的CNN-GRU模型，超参数采用人工经验设置，结构与本文提出的CNN-GRU模块一致。

（4）实验组：本文提出的DOA-CNN-GRU模型，超参数通过DOA算法寻优得到，结构与3.4节设计一致。

所有对照组与实验组的训练集、测试集、训练参数（除超参数外）保持一致，确保实验结果的可比性。

4.2.2 性能评估指标

本次实验采用分类准确率、精确率、召回率、F1值四个常用指标评估模型的分类性能，同时通过混淆矩阵直观展示模型的分类结果，具体指标定义如下：

（1）分类准确率：正确分类的样本数占总样本数的比例，反映模型的整体分类效果，取值范围为[0,1]，值越大越好。

（2）精确率：被正确分类为某一类别的样本数占该类别所有预测样本数的比例，反映模型预测的准确性，值越大越好。

（3）召回率：被正确分类为某一类别的样本数占该类别真实样本数的比例，反映模型对该类别的识别能力，值越大越好。

（4）F1值：精确率与召回率的调和平均数，综合反映模型的分类性能，取值范围为[0,1]，值越大越好。

4.2.3 实验步骤

本次实验的具体步骤如下：

（1）数据预处理：对两个数据集分别进行数据清洗、归一化、分层抽样划分训练集与测试集、数据格式转换，得到适合模型输入的标准化数据。

（2）超参数优化：利用DOA算法对实验组模型的三个关键超参数进行寻优，确定最优超参数组合，记录优化过程中的适应度曲线，观察算法的收敛情况。

（3）模型训练：分别训练4组对照实验与实验组模型，记录模型的训练过程、训练时间、收敛情况，确保模型训练达到稳定状态。

（4）性能测试：利用测试集对训练好的模型进行性能测试，计算各模型的分类准确率、精确率、召回率、F1值，绘制混淆矩阵，记录实验结果。

（5）稳定性验证：每组实验重复进行10次，计算各性能指标的平均值与标准差，验证模型的稳定性。

4.3 实验结果与分析

4.3.1 DOA超参数优化结果分析

通过DOA算法对CNN-GRU模型的超参数进行寻优，得到两个数据集对应的最优超参数组合如下：

（1）工业故障诊断数据集：初始学习率为0.0052，GRU层隐藏节点数为22，L2正则化系数为0.0008。

（2）医疗信号处理数据集：初始学习率为0.0065，GRU层隐藏节点数为18，L2正则化系数为0.0006。

DOA算法的适应度曲线显示，随着迭代次数的增加，适应度值逐渐下降并趋于稳定，在迭代15次左右达到收敛，表明DOA算法能够快速寻找到最优超参数组合，收敛速度快、寻优精度高，有效解决了人工调参的不足。

4.3.2 分类性能对比分析

两个数据集上各模型的分类性能指标平均值与标准差如下（10次重复实验结果）：

（1）工业故障诊断数据集：实验组（DOA-CNN-GRU）的分类准确率为98.2%，精确率为98.1%，召回率为98.3%，F1值为98.2%；对照组3（未优化CNN-GRU）的分类准确率为92.5%，精确率为92.3%，召回率为92.6%，F1值为92.4%；对照组1（CNN）的分类准确率为88.7%，精确率为88.5%，召回率为88.8%，F1值为88.6%；对照组2（GRU）的分类准确率为89.3%，精确率为89.1%，召回率为89.4%，F1值为89.2%。

（2）医疗信号处理数据集：实验组的分类准确率为97.5%，精确率为97.4%，召回率为97.6%，F1值为97.5%；对照组3的分类准确率为91.8%，精确率为91.6%，召回率为91.9%，F1值为91.7%；对照组1的分类准确率为87.2%，精确率为87.0%，召回率为87.3%，F1值为87.1%；对照组2的分类准确率为88.5%，精确率为88.3%，召回率为88.6%，F1值为88.4%。

从实验结果可以看出，实验组模型的各项性能指标均显著优于三个对照组，分类准确率比未优化的CNN-GRU模型提升了5%以上，比传统CNN、GRU模型提升了8%以上，且标准差较小（均小于0.5%），表明DOA-CNN-GRU模型具有更高的分类精度和稳定性。这是因为DOA算法寻找到的最优超参数组合使模型能够更好地平衡拟合能力与泛化能力，同时CNN与GRU的协同作用能够充分捕捉数据中的时空特征，提升了模型的分类性能。

4.3.3 混淆矩阵分析

混淆矩阵结果显示，实验组模型在两个数据集上的误分类样本数量显著少于对照组。在工业故障诊断数据集中，实验组仅出现5个误分类样本，主要集中在轴承磨损与齿轮故障的区分上；而对照组3出现22个误分类样本，对照组1和对照组2分别出现34个和32个误分类样本。在医疗信号处理数据集中，实验组仅出现6个误分类样本，主要集中在心律失常与心肌缺血的区分上；对照组3出现19个误分类样本，对照组1和对照组2分别出现38个和34个误分类样本。

混淆矩阵分析表明，DOA-CNN-GRU模型能够更准确地识别不同类别的样本，尤其是在类别相似的样本区分上具有明显优势，进一步验证了模型的分类性能优势。

5 SHAP可解释性分析与特征依赖图解读

5.1 SHAP可解释性分析设计

为揭示DOA-CNN-GRU模型的决策逻辑，本文基于测试集样本开展SHAP可解释性分析，具体步骤如下：首先，从测试集中选取全部样本，计算每个样本中各特征的SHAP值，量化每个特征对模型预测结果的边际贡献；其次，通过SHAP摘要图、特征重要性条形图，分析模型的全局决策规律，识别影响模型预测的核心特征；最后，选取典型样本，通过力导图分析单个样本的预测过程，验证SHAP分析结果的合理性。

SHAP分析过程中，采用基于蒙特卡洛采样的KernelSHAP方法计算SHAP值，确保计算结果的准确性与效率；可视化工具采用SHAP库自带的可视化函数，确保图表的直观性与可读性。

5.2 全局SHAP分析结果与解读

5.2.1 特征重要性分析

特征重要性条形图通过计算各特征的平均绝对SHAP值，排序展示特征的重要程度，平均绝对SHAP值越大，表明该特征对模型预测结果的影响越大。两个数据集的特征重要性分析结果如下：

（1）工业故障诊断数据集：排名前3的核心特征分别为振动信号的峰值、均方根值、频率方差，其平均绝对SHAP值分别为0.82、0.75、0.68，远高于其他特征。这与领域知识一致，峰值和均方根值能够直接反映机械设备的振动强度，频率方差能够反映振动信号的稳定性，是判断设备故障状态的关键特征。

（2）医疗信号处理数据集：排名前3的核心特征分别为ECG信号的心率、PR间期、QRS波宽度，其平均绝对SHAP值分别为0.79、0.72、0.65，这些特征是临床诊断中心血管疾病的关键指标，能够直接反映心脏的生理状态，与领域知识高度契合。

特征重要性分析结果表明，DOA-CNN-GRU模型能够自动识别数据集中的核心特征，其关注的特征与领域专家的判断一致，说明模型的决策逻辑具有合理性和科学性，并非盲目学习数据中的噪声信息。

5.2.2 SHAP摘要图分析

SHAP摘要图展示了所有测试样本中各特征的SHAP值分布，横轴为SHAP值，纵轴为特征名称，每个点代表一个样本中该特征的SHAP值，点的颜色代表特征的取值（颜色越深，特征取值越大）。两个数据集的SHAP摘要图分析结果如下：

（1）工业故障诊断数据集：核心特征峰值的SHAP值多为正值，且特征取值越大，SHAP值越大，表明峰值越大，模型预测设备存在故障的概率越高；均方根值的SHAP值也多为正值，取值越大，对故障预测的正向贡献越大；频率方差的SHAP值在取值较小时为负值，取值较大时为正值，表明频率方差较小时，设备运行状态更稳定，频率方差较大时，设备更可能存在故障。

（2）医疗信号处理数据集：核心特征心率的SHAP值在取值过高或过低时均为正值，取值在正常范围（60-100次/分钟）时为负值，表明心率异常时，模型预测存在心血管疾病的概率越高；PR间期的SHAP值在取值过长时为正值，取值正常时为负值，表明PR间期过长是心律失常的重要判断依据；QRS波宽度的SHAP值在取值过宽时为正值，对疾病预测具有正向贡献。

SHAP摘要图清晰地展示了各特征对模型预测结果的正负向影响规律，与领域知识一致，进一步验证了模型决策逻辑的合理性，同时也揭示了特征取值与预测结果之间的复杂关联。

5.3 特征依赖图解读

为进一步揭示单个特征与模型预测结果之间的非线性关系，本文针对两个数据集的前3个核心特征，绘制特征依赖图，分析特征取值变化对模型预测结果的影响趋势。

5.3.1 工业故障诊断数据集特征依赖图解读

（1）峰值特征依赖图：横轴为峰值取值，纵轴为SHAP值，随着峰值取值的增加，SHAP值呈单调递增趋势，当峰值取值小于0.3时，SHAP值为负，对故障预测具有负向贡献（即预测设备正常）；当峰值取值大于0.3时，SHAP值转为正值，且随着取值的增加，正向贡献逐渐增强，表明峰值超过一定阈值后，设备存在故障的概率显著提升，这与实际故障诊断逻辑一致。

（2）均方根值特征依赖图：随着均方根值的增加，SHAP值呈非线性递增趋势，取值在0-0.2时，SHAP值变化较小，对预测结果的影响较弱；取值在0.2-0.5时，SHAP值快速上升，对故障预测的正向贡献显著增强；取值大于0.5时，SHAP值趋于稳定，表明均方根值达到一定程度后，设备故障的可能性已基本确定。

（3）频率方差特征依赖图：随着频率方差的增加，SHAP值呈先负后正的变化趋势，取值在0-0.1时，SHAP值为负，且绝对值逐渐减小，表明频率方差较小时，设备运行稳定，随着方差的增加，稳定性逐渐下降；取值大于0.1时，SHAP值转为正值，且随着取值的增加，正向贡献逐渐增强，表明频率方差超过阈值后，设备更可能存在故障。

5.3.2 医疗信号处理数据集特征依赖图解读

（1）心率特征依赖图：横轴为心率取值，纵轴为SHAP值，SHAP值呈“U”型分布，心率在60-100次/分钟（正常范围）时，SHAP值为负，对疾病预测具有负向贡献（即预测正常）；当心率小于60次/分钟或大于100次/分钟时，SHAP值为正，且偏离正常范围越远，SHAP值越大，正向贡献越强，表明心率异常越严重，存在心血管疾病的概率越高，与临床诊断标准完全一致。

（2）PR间期特征依赖图：随着PR间期取值的增加，SHAP值呈单调递增趋势，取值小于0.12秒时，SHAP值为负，表明PR间期正常，对疾病预测无正向贡献；取值在0.12-0.20秒（正常范围）时，SHAP值接近零，影响较小；取值大于0.20秒时，SHAP值转为正值，且随着取值的增加，正向贡献逐渐增强，表明PR间期过长是心律失常的重要特征。

（3）QRS波宽度特征依赖图：随着QRS波宽度的增加，SHAP值呈非线性递增趋势，取值小于0.12秒时，SHAP值为负，表明QRS波宽度正常；取值在0.12-0.14秒时，SHAP值快速上升，对疾病预测的正向贡献增强；取值大于0.14秒时，SHAP值趋于稳定，表明QRS波宽度过宽时，存在心血管疾病的概率较高。