（论文速读）SN-CA-SSD：轻量级风机叶片缺陷检测新方法

LJ1147517021

379人浏览 · 2026-05-02 09:51:13

LJ1147517021 · 2026-05-02 09:51:13 发布

论文题目：Defect Detection Using Shuffle Net-CA-SSD Lightweight Network for Turbine Blades in IoT（基于Shuffle Net-CA-SSD轻量级网络的物联网涡轮叶片缺陷检测）

期刊：IEEE INTERNET OF THINGS JOURNAL

摘要：叶片缺陷的早期检测对于物联网(IoT)涡轮机至关重要，因为它可以防止故障，最大限度地减少停机时间，并提高系统可靠性。基于深度学习的方法提高了缺陷识别和分类的准确性。然而，在识别效率、准确性和检测小目标的能力之间的平衡方面存在着挑战。为此，本文建立了基于ShuffleNetv2和协同关注(SNCA-SSD)的物联网中涡轮叶片单次多盒检测的轻量化缺陷检测模型。首先，在单镜头多盒检测器框架内，ShuffleNetv2取代VGG-16网络作为基本特征提取网络。这种替换确保了检测的准确性，同时降低了模型的复杂性。其次，在特征映射之后引入坐标注意机制，对重要特征进行加权，增强模型对关键信息的感知能力;最后，利用EIoU (Efficient Intersection over Union)损失对损失函数进行了重新设计，提高了检测目标的精度和定位精度。将该方法应用于涡轮叶片缺陷检测图像，结果表明，该算法显著提高了检测精度、检测效率和检测小目标的能力，在精度和效率之间取得了平衡。通过将模型与可解释算法相结合，从表示可视化的角度分析算法的决策过程，增强算法的可解释性。

轻量级风机叶片缺陷检测新方法：SN-CA-SSD 详解

一、研究背景与动机

随着工业物联网（IoT）的快速发展，风力发电作为清洁能源的重要组成部分受到广泛关注。风机叶片是风力发电系统的核心部件，长期暴露于高温、高速、强腐蚀的恶劣环境中，极易出现疲劳损伤乃至断裂，由此引发严重安全事故。因此，对风机叶片进行早期缺陷检测，对于预防故障、减少停机时间、提升系统可靠性具有重大的工程意义。

近年来，深度学习方法已被广泛应用于缺陷检测领域，其通过网络结构自动提取特征，无需手工特征工程，具备较强的泛化性和鲁棒性。然而，现有方法仍面临以下几个核心挑战：

1.1 现有方法的主要问题

（1）模型复杂度过高，难以部署于IoT设备

以 Faster-RCNN 为代表的两阶段检测器参数量高达 137M，FLOPs 达 226.408G，单张图片检测耗时 1.16 秒，远不满足实时部署需求。传统 SSD 以 VGG-16 为骨干网络，参数量为 26.29M，FLOPs 为 62.798G，效率同样不够理想。

（2）小目标缺陷检测能力不足

早期裂纹、微小孔洞等小尺寸缺陷在特征图上的响应极弱，现有模型容易漏检，制约了缺陷的早期发现。

（3）损失函数设计不够精细

原始 SSD 的定位损失采用简化的 IoU 计算方式，未考虑检测框的形状、尺度等几何细节，导致边界框回归精度不足，定位误差较大。

（4）模型可解释性差，工程信任度低

深度学习模型的"黑箱"特性使得决策过程不透明，工程人员难以理解模型判断依据，降低了实际部署的信任度与可接受程度。

（5）效率与精度难以兼顾

YOLOv5 的 mAP 仅为 86.52%，YOLOv6 提升至 92.67%，但参数量（37.62M）和 FLOPs（106.472G）仍然偏高；Faster-RCNN 精度为 89.24%，但速度极慢。现有方法均未能在精度、速度与模型轻量化三者之间取得良好平衡。

二、论文提出的方法：SN-CA-SSD

针对上述挑战，本文提出了一种轻量级风机叶片缺陷检测模型——SN-CA-SSD（Single-shot Multibox Detection based on ShuffleNetv2 and Coordinate Attention），围绕以下四个核心创新点展开设计。

📷 【此处配图：图1 SN-CA-SSD网络整体结构图（Fig. 1）】

2.1 创新一：以 ShuffleNetv2 替代 VGG-16 作为骨干网络

设计思路：传统 SSD 以 VGG-16 作为特征提取骨干，参数量大、计算开销高。本文引入 ShuffleNetv2 这一轻量级高效神经网络架构，作为新的骨干网络。

技术细节：

ShuffleNetv2 通过通道混洗（Channel Shuffle）和分组卷积（Group Convolution）减少参数量和计算量。
每个 ShuffleNet 单元由 1×1 卷积、3×3 深度可分离卷积（DW Conv）和另一个 1×1 卷积组成。
模型分为三个阶段：第一阶段含 3 个 ShuffleNet 单元，提取低层特征；第二阶段含 7 个单元，作为主要特征提取网络；第三阶段含 3 个单元，进行高层特征提取。
用步长为 2 的卷积层代替池化层，在缩小特征图尺寸的同时，减少信息损失并降低参数量。

效果：在保持检测精度的前提下，大幅降低模型复杂度，实现快速推理，适合在 IoT 边缘设备上部署。

2.2 创新二：嵌入坐标注意力机制（Coordinate Attention, CA）

设计思路：为了增强模型对关键缺陷区域的感知能力，本文在 ShuffleNetv2 的特征图输出后嵌入坐标注意力（CA）模块，共在骨干网络输出和额外特征层的4个模块中共添加了5个CA机制。

CA 机制的工作原理分为两个核心步骤：

① 坐标信息嵌入

利用全局池化，分别沿水平和垂直方向对输入特征图 X 进行编码，生成携带空间位置信息的通道描述子：

$Z_c^h(h) = \frac{1}{W}\sum_{0 \leq i < W} x_c(h,i)$

$Z_c^w(\omega) = \frac{1}{H}\sum_{0 \leq j < H} x_c(j,\omega)$

这一步同时保留了空间依赖关系和精确的位置信息，弥补了传统通道注意力（如 SE 模块）忽略空间信息的缺陷。

② 注意力权重生成

将水平和垂直方向的特征图拼接后，经过 1×1 卷积、Batch Norm 和非线性激活，得到中间特征图 f；再沿空间维度分离为两个张量，分别通过独立卷积和 Sigmoid 激活得到水平注意力权重 $g^w$ 和垂直注意力权重 $g^h$ ；最终输出：

$y_c(i,j) = x_c(i,j) \times g_c^h(i) \times g_c^w(j)$

效果：CA 模块自适应地学习通道权重，突出目标特征响应，显著提升了对小目标缺陷的检测精度和定位能力。

2.3 创新三：改用 EIoU 损失函数优化边界框回归

设计思路：原始 SSD 损失函数的定位部分过于简单，本文将定位损失替换为 EIoU（Efficient Intersection over Union）损失，对边界框回归进行更精细的建模。

技术细节：EIoU 在 CIoU 的基础上进行改进，将边界框回归损失分解为三个独立分量：

重叠损失（Loss_iou）：预测框与真实框的交并比
中心距离损失（Loss_dis）：两框中心点的距离惩罚
宽高损失（Loss_asp）：直接最小化预测框与真实框的宽度差和高度差

最终总损失函数为：

$L = \frac{1}{N_{pos}}\sum_{i \in pos} L^{(i)}{class} + \alpha L{loc}$

其中 $\alpha = 0.45$ ， $L_{loc} = 1 - \text{EIoU}(b_i, \hat{b}_i)$ 。

相比 CIoU，EIoU 直接独立优化宽高差，收敛速度更快，对小目标和密集目标的处理效果更佳，还能降低重叠框的误检率。

2.4 创新四：引入 Augmented Grad-CAM++ 可解释性分析

为提升模型在工程场景中的透明度与可信度，本文结合 Augmented Grad-CAM++ 算法对各模型最终层的特征提取过程进行可视化，生成热力图以直观呈现模型关注的缺陷区域。

📷 【此处配图：图6 不同方法的热力图特征可视化对比（Fig. 6）】

三、实验设置

3.1 实验环境

框架：TensorFlow
硬件：Intel Core i7-11700 CPU @ 2.50 GHz，8GB RAM，Windows 10
学习率：0.002–0.01（网格搜索确定最优值）
批大小（Batch Size）：200
数据增强：旋转、平移等几何增强

3.2 数据集

实验使用一个公开的IoT采集风机叶片缺陷图像数据集，包含数千张图像，涵盖以下7类样本：

类别	说明
Burn（烧伤）	高温造成的表面灼伤
Crack（裂纹）	疲劳或冲击造成的裂缝
Exfoliation（剥落）	涂层或材料脱落
Hole（孔洞）	贯穿性损伤
Lack（缺料）	材料缺失
Rusty（锈蚀）	腐蚀性损伤
Normal（正常）	无缺陷参考样本

四、实验结果与分析

4.1 精度对比（mAP）

📊 【此处配表：表I 不同模型精度对比（Table I）】

📷 【此处配图：图2 不同方法检测效果对比图（Fig. 2）】

SN-CA-SSD 在各类缺陷上的平均精度（mAP）达到 95.46%，显著优于其他对比方法：

较基础 SSD（84.48%）提升约 11个百分点
较 YOLOv5（86.52%）提升约 9个百分点
较 Faster-RCNN（89.24%）提升约 6个百分点
较 YOLOv6（92.67%）提升约 3个百分点

值得注意的是，SN-CA-SSD 在 Hole 类别上达到 99.89%，Lack 类别上达到 100%，体现了其对不同尺度和形状缺陷的强适应能力。

4.2 召回率对比（Recall）

📊 【此处配表：表II 不同模型召回率对比（Table II）】

📷 【此处配图：图3 SN-CA-SSD召回率曲线（Fig. 3）】

SN-CA-SSD 的平均召回率为 98.37%，超越所有对比方法（YOLOv6为 95.66%），说明该模型能发现更多真实缺陷，漏检率更低，在安全关键场景中尤为重要。

4.3 F1 值对比

📊 【此处配表：表III 不同模型F1值对比（Table III）】

📷 【此处配图：图4 SN-CA-SSD F1曲线（Fig. 4）】

SN-CA-SSD 的 F1 值达到 97%，在精确率和召回率上均表现优异，综合性能最佳（YOLOv6为 93%，Faster-RCNN 为 90%）。

4.4 效率与模型复杂度对比

📊 【此处配表：表IV 不同模型性能效率对比（Table IV）】

这是 SN-CA-SSD 最突出的优势所在：

指标	SSD	YOLOv5	Faster-RCNN	YOLOv6	SN-CA-SSD
参数量（M）	26.29	64.43	137	37.62	6.932
FLOPs（G）	62.798	60.334	226.408	106.472	4.170
检测时间（s/张）	0.21	0.32	1.16	0.15	0.06

SN-CA-SSD 的参数量仅为基础 SSD 的 26%，FLOPs 仅为其 6.6%，检测速度提升近 4倍，充分验证了其轻量化设计的有效性，完全满足 IoT 边缘部署的资源约束需求。

4.5 消融实验

📊 【此处配表：表V 消融实验性能对比（Table V）】

为验证各模块的独立贡献，论文进行了系统的消融实验：

模型配置	mAP	参数量（M）	FLOPs（G）
SSD（基线）	81.69%	26.29	62.798
ShuffleNetv2-SSD + CA	85.46%	5.182	3.816
ShuffleNetv2-SSD + EIoU	86.41%	5.431	3.762
ShuffleNetv2-SSD + CA + EIoU（完整模型）	95.06%	6.932	4.17