无人机拍矿区→AI找裂缝→几何量化：DRA-UNet采矿地裂缝检测与形态分析全流程

Coovally AI模型快速验证

519人浏览 · 2026-04-09 16:58:57

Coovally AI模型快速验证 · 2026-04-09 16:58:57 发布

导读

地下采煤导致的地表裂缝是矿区地质灾害最直接的信号——它不仅破坏地面承载力，还会加速地表水下渗，引发滑坡和塌陷等次生灾害。然而，矿区地裂缝的自动检测面临独特困难：裂缝形态高度不规则（宽窄共存、分支弯曲）、背景干扰严重（砾石、植被、土壤纹理），且裂缝像素在图像中占比极小。

河南理工大学团队提出了一套从检测到分析的完整框架：首先用改进的 DRA-UNet从无人机正射影像中分割裂缝（D=双注意力机制、R=残差学习、A=空洞空间金字塔池化），然后通过骨架提取和几何参数量化，对裂缝的长度、宽度、面积和矩形度进行系统分析，最终在工作面尺度上揭示裂缝的空间分布规律。

在霍家兔煤矿无人机数据集上，DRA-UNet 的 F1 达到 71.60%、MIoU 达到 70.00%，在六种方法中最优。在公开的 Crack500 数据集上跨场景验证，F1 进一步达到 85.32%、MIoU 达到 83.69%。消融实验验证了每个模块的贡献，几何分析揭示了裂缝长度、宽度、面积的右偏分布特征，以及裂缝密度和复杂度在工作面边界附近显著增高的空间规律。

论文信息

标题：Automatic identification and feature analysis of Mining-Induced surface cracks using an improved DRA-UNet
作者：Weiwei Zhou, Youfeng Zou, Huabin Chai
机构：Henan Polytechnic University, Jiaozuo, China
发表：Scientific Reports, 2026, 16:6591

一、矿区地裂缝：比路面裂缝难检测得多

与道路或混凝土裂缝相比，采矿诱发的地表裂缝在检测上面临更大挑战：

形态复杂：主裂缝与次生裂缝共存，宽窄差异大，常伴随分支和弯曲
背景干扰强：矿区地表有砾石、植被、土壤纹理和阴影，容易产生误检
空间分布受地质控制：裂缝分布与地质构造、开采推进方向和下沉梯度密切相关
类别极度不平衡：裂缝像素在图像中的占比极小，背景占据绝对主导

现有研究多集中于提升分割精度，而将裂缝检测与几何量化分析、空间分布分析结合的工作仍然不足。本文的目标正是建立一个检测+量化+空间分析的完整框架。

二、DRA-UNet：在U-Net上叠加三个增强模块

基础架构

以经典 U-Net为基线。选择 U-Net 的理由是：编码器-解码器结构配合跳跃连接，适合保留细长裂缝的空间细节；参数量适中，适合有限的矿区数据集；模块化结构便于逐一评估每个改进的贡献。

三个核心改进

1. 残差学习（R — Basic Block）

在编码器和解码器的卷积层中引入 Basic Block 残差模块（即 ResNet 基本残差块：两层 3×3 卷积 + 跳跃连接），改善梯度流动，稳定深层网络训练。

2. 双注意力机制（D — DAM）

DAM 由 位置注意力模块（PAM）和 通道注意力模块（CAM）组成。在编码阶段，DAM 作用于高分辨率特征图，突出裂缝结构信息、抑制背景噪声；在解码阶段，DAM 利用局部和全局上下文细化上采样特征，使裂缝边界和纹理更清晰。

3. 空洞空间金字塔池化（A — ASPP）

在瓶颈层嵌入 ASPP 模块，使用扩张率为 1、2、4、6 的空洞卷积加上全局平均池化，从多个感受野尺度提取语义特征，增强对不同宽度和复杂形态裂缝的识别能力。

三个模块的协作逻辑是：DAM 提供更干净、更聚焦的特征输入 → ASPP 在此基础上提取多尺度上下文信息 → 残差连接保证信息在深层网络中的高效流动。

图片来源于原论文

混合损失函数

针对裂缝像素占比极小的特点，设计了三组分混合损失：

组分	权重	作用
Focal Tversky Loss	0.6	加强对漏检（FN）的惩罚，聚焦难以检测的细长裂缝
BCEWithLogitsLoss	0.3	稳定像素级二分类概率优化
Edge Consistency Loss	0.1	基于 Sobel 梯度算子约束预测边界与真实边界的一致性

训练配置

参数	设置
框架	PyTorch
优化器	AdamW
学习率	1×10⁻⁴
批大小	8
输入尺寸	256×256 像素
最大轮次	200
数据增强	亮度/对比度调整、水平/垂直翻转、90°/180°旋转

三、霍家兔煤矿数据集与实验结果

研究区域与数据集

霍家兔煤矿位于陕西省榆林市大柳塔镇，处于陕西与内蒙古交界、毛乌素沙漠南部。研究选取的工作面走向长度约 2700 m，倾向长度约 300 m，开采 2-2 号煤层（平均埋深约 145 m，平均厚度约 4.2 m）。

无人机影像由 DJI M300-RTK搭载 Zenmuse H20T传感器（集成广角相机、热成像和激光测距）采集，地面分辨率 2.76 cm。影像经 Pix4DMapper 处理后生成正射影像，裁切为 256×256 像素块（25%重叠），共生成 6000 个样本，按 8:1:1 划分训练/验证/测试集。标注采用人工目视解释后二值化（背景=0，裂缝=255）。

与五种方法的性能对比

模型	Pr（%）	Re（%）	F1（%）	MIoU（%）
DeepLabV3+	71.21	69.12	70.15	65.10
SegNet	63.55	68.46	65.91	63.59
PSPNet	64.76	68.41	66.53	67.57
SegFormer	67.01	69.63	68.29	69.25
FastSCNN	62.90	67.08	64.92	66.96
DRA-UNet	71.10	72.20	71.60	70.00

DRA-UNet 的 Precision 略低于 DeepLabV3+（71.10% vs 71.21%），但 Recall 在所有模型中最高（72.20%），说明其对裂缝的捕获能力更强。F1 和 MIoU 均为最优，分别比次优方法高出 +1.45（vs DeepLabV3+ 的 70.15%）和 +0.75（vs SegFormer 的 69.25%）。

图片来源于原论文

Crack500 跨场景验证

为验证泛化能力，在公开的 Crack500 数据集（路面裂缝）上测试：

模型	Pr（%）	Re（%）	F1（%）	MIoU（%）
DeepLabV3+	80.12	85.13	82.55	81.84
SegNet	81.28	86.96	84.02	80.64
PSPNet	80.55	83.89	82.19	83.01
SegFormer	82.21	83.23	82.72	83.26
FastSCNN	83.85	85.49	84.66	82.54
DRA-UNet	83.12	87.68	85.32	83.69

DRA-UNet 的 MIoU 最高（83.69%），Recall 和 F1 同样最优。Precision 略低于 FastSCNN（83.12% vs 83.85%），但综合分割质量最佳。

四、消融实验：三个模块各贡献多少？

在矿区无人机数据集上，对残差模块（ResNet）、双注意力机制（DAM）和 ASPP 三个组件进行消融实验：

配置	Pr（%）	Re（%）	F1（%）	MIoU（%）
U-Net（基线）	65.52	67.43	66.46	65.90
+ ResNet	68.46	68.97	68.71	66.86
+ DAM	66.57	67.56	67.06	66.05
+ ASPP	66.78	67.44	67.11	66.88
+ ResNet + DAM	68.90	70.08	69.48	68.23
+ ResNet + ASPP	68.98	69.53	69.25	67.95
+ DAM + ASPP	67.46	67.58	67.52	67.44
+ ResNet + DAM + ASPP	71.10	72.20	71.60	70.00

几个关键发现：

残差模块贡献最大：单独加入 ResNet，F1 从 66.46% 提升到 68.71%（+2.25），而 DAM 和 ASPP 单独加入的提升分别仅为 +0.60 和 +0.65
DAM 和 ASPP 需要残差基础才能发挥最大作用：DAM+ASPP 组合（无 ResNet）F1 仅为 67.52%，但 ResNet+DAM+ASPP 三者联合达到 71.60%，说明残差连接为注意力和多尺度模块提供了更优质的特征基础
三模块联合的增益大于任意两两组合：最终 F1（71.60%）比最优两模块组合 ResNet+DAM（69.48%）还高 +2.12，呈现协同增益

五、总结与思考

本文提出了面向矿区地表裂缝的完整框架：DRA-UNet 语义分割（F1=71.60%/MIoU=70.00%）→ 骨架提取与几何量化 → 工作面尺度空间分析。几何分析揭示裂缝长度、宽度和面积均呈右偏长尾分布（均值：长度 2.12 m，宽度 7.73 cm），矩形度随裂缝长度增加而下降；空间分析表明工作面边界附近裂缝密度和复杂度显著增高，内部裂缝呈特征性的"C形"张开模式。

在此基础上，有几点值得进一步思考：

检测-量化-空间分析的三层框架是本文的核心贡献。多数裂缝检测论文止步于分割精度，而本文将骨架提取和几何参数量化纳入流程，使检测结果能直接服务于灾害评估和维护决策——这种"从像素到工程"的思路值得参考。
单矿区数据存在局限。6000 个样本均来自霍家兔煤矿，属于半干旱环境。Crack500 的跨场景验证虽然表现不错（MIoU=83.69%），但路面裂缝与采矿地裂缝在形态和背景上存在本质差异，跨域适用性仍需进一步验证。
论文定位为离线分析工具，未报告推理速度和计算资源需求。对于需要快速响应的矿区巡检场景，如何部署到无人机机载平台或边缘设备是后续需要解决的问题。