Crack segmentation network via difference convolution-based encoder and hybrid CNN-Mamba multi-scale attention

1. 研究背景
  • 工业背景:路面裂缝是最常见的路面损坏形式,若不及时修复会导致严重的结构性破坏。

  • 技术现状:裂缝通常呈现出细长、不规则的几何特征。传统的深度学习网络(如 U-Net, SegNet, DeepLabV3+)在处理复杂背景(如下雨、阴影、油渍干扰)时,容易出现断裂或误检测。

  • 新架构兴起:虽然 Transformer 在长距离依赖建模上表现出色,但其计算复杂度随图像尺寸呈平方增长 ($O(N^2)$)。Mamba (State Space Model) 作为一种具有线性复杂度 ($O(N)$) 的新架构,在处理长序列信息方面展现出巨大潜力。

2. 科学问题
  • 边缘丢失:标准卷积神经网络在特征提取过程中容易丢失裂缝边缘的细微信息。

  • 长距离依赖建模:裂缝往往贯穿整幅图像,局部卷积难以捕捉裂缝的整体连通性。

  • 计算开销:如何在保证捕捉全局特征的同时,降低模型的计算复杂度和内存占用?

3. 主要方法 (DCCM-Net)

该研究提出了一种名为 DCCM-Net 的混合架构,核心模块包括:

  • 增强卷积模块 (ECM):作为编码器的核心,引入了差分卷积(Difference Convolution)

    • 与标准卷积只学习强度信息不同,差分卷积通过计算中心像素与周围像素的差异,显式地增强了对裂缝边缘纹理的提取能力。

  • 混合 CNN-Mamba 多尺度注意力 (HCM-MA)

    • CNN 分支:负责提取局部空间细节。

    • Mamba 分支:利用选择性状态空间模型(SSM)进行长距离建模,捕捉裂缝的整体形态,且计算量远低于 Transformer。

  • 多尺度策略:在不同分辨率下并行处理特征,确保网络对不同宽度(从发丝裂缝到大裂缝)的鲁棒性。

4. 核心发现
  • 性能跨越:在三个公开数据集(Crack500, DeepCrack, GAPS)上的表现均优于目前主流的分割网络。

  • 边缘完整性:消融实验证明,差分卷积显著改善了细长裂缝边缘的平滑度和连通性。

  • 效率优势:相比于基于 Transformer 的同类模型(如 SegFormer),DCCM-Net 在保持甚至超越其性能的同时,推理速度更快,内存占用更低。

5. 主要结论
  • 差分卷积与 Mamba 的结合是处理具有强边缘特征且分布广泛的物体(如裂缝、道路、水系等)的有效手段。

  • 该模型不仅在学术指标上领先,其高效的计算特性使其更适合部署在实时路面巡检车辆或移动设备上。

6. 亮点与不足
  • 亮点

    • 架构创新:紧跟技术前沿,首次在裂缝分割领域大规模验证了 Mamba 架构的有效性。

    • 纹理敏感:通过改进卷积方式(ECM)从底层原理上解决了裂缝边缘特征提取难的问题。

    • 端到端设计:整个网络设计精巧,多尺度注意力机制能够自适应地忽略路面干扰(如光照和污渍)。

  • 不足

    • 泛化验证:研究主要集中在路面裂缝,对于其他材质表面(如金属表面、桥梁内部)的裂缝分割效果还需进一步验证。

    • 超参数敏感性:Mamba 架构中的扫描机制(Scan direction)对裂缝走向可能有一定的偏好,论文对不同扫描方向的影响讨论较少。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐