【AAAI 2025】IRMamba: Pixel Difference Mamba with Layer Restoration for Infrared Small TargetDetection
论文作者:Mingjin Zhang, Xiaolong Li, Fei Gao, Jie Guo
发布期刊:AAAI
发布年份:2025
论文主要贡献
红外小目标检测(IRSTD)专注于识别红外图像中的小目标。尽管深度学习取得了进展,但由于红外远距离成像机制的存在,挑战依然存在——在这种机制下,目标体积小、亮度低,且容易淹没在噪声和背景杂波中。当前的深度学习方法难以在抑制噪声和背景干扰的同时保留精细细节,从而导致漏检和误报。为解决这些问题,我们提出了IRMamba,这是一种编码器-解码器架构,包含像素差异曼巴(PDMamba)和层恢复模块(LRM)。具体而言,PDMamba将扫描位置与其中心邻域之间像素差异的强度和方向信息整合到状态空间模型(SSM)的状态方程中。这通过从全局角度捕捉局部二维依赖关系,增强了目标细节表征并抑制了背景干扰。此外,LRM将双深度图像先验融入迭代收敛算法,并利用层间相互关系逐步逆转目标层的分离,实现了噪声抑制和图像掩码的精细重建。在多个公共数据集(包括NUAA-SIRST、NUDT-SIRST和IRSTD-1K)上进行的实验表明,IRMamba相比现有最优方法具有显著优势。
论文创新点
- 我们首次将一种新颖的设计——IRMamba引入红外小目标检测领域。在具有挑战性的基准测试中,所提出的IRMamba在客观指标和主观评价上均优于现有最佳方法,展现出其卓越的性能。
- 我们设计PDMamba,通过计算扫描点与相邻中心之间的差异来捕捉邻域信息和目标轮廓细节。利用红外图像的空间分布,我们在状态方程中采用权重函数来增强目标,同时抑制背景干扰。
- 我们证明了从含噪图像中分离清晰层的可行性,随后提出了一种图像恢复策略。LRM通过交替进行双向梯度下降和交叉近端映射,以抑制累积噪声并恢复图像掩码。
方法

IRMamba整体采用 Encoder–Decoder结构,类似 U-Net,但在结构上进行了重要改进。编码器由两个并行堆叠的卷积模块和VSS块模块组成,使用 PDMamba 增强局部像素关系,同时保留 Mamba的全局建模能力。同时通过门控机制共享一些相互关联以实现特征互补。解码器依次堆叠补丁扩展、ResNet块和LRM,以逐步恢复掩码。
Pixel Difference Mamba(PDMamba)
PDMamba核心思想是在状态更新中加入邻域差分信息:
h(t) = A·h(t−1)+ B·x(t)+ Σ [ Wx(i)Δx(i) + Wy(i)Δy(i) ]
其中:Δx(i):水平方向差分 Δy(i):垂直方向差分
论文设计如下差分计算:
水平方向:Δx(o+i) Δx(o−i)
计算公式:Δx(o+i) = (1/(2k+1)) Σ (x(t+k) − x(t+k+1))
Δx(o−i) = (1/(2k+1)) Σ (x(t−k+1) − x(t−k))
垂直方向同理。
图2:扫描方法示意图。论文将差分运算引入状态方程,使Mamba能够在扫描过程中捕捉扫描点与中心邻域之间的差异信息。这种方法增强了捕捉局部依赖关系的能力。
Spatial Distribution Function
仅靠像素差分还不足以区分真实目标和高亮背景噪声,例如建筑边缘云层海面反射,这些也可能产生强差分。因此论文提出空间分布函数,利用红外目标的空间对称特性,小目标通常满足四方向梯度同时较大的条件,而背景通常仅在某一方向变化。因此论文设计了函数f(Δx, Δy,x(t))判断是否符合目标分布:
最终状态方程为:
Layer Restoration Module(LRM)

Encoder 会提取特征,但也会引入噪声Decoder如果简单融合Low-level features和High-level features,可能导致噪声累积,因此论文提出将目标检测看作图像恢复问题,使用图像退化模型:Y = Ax + n。
一幅图像可以分解为目标层+背景层,表示为:Z = βY + (1−β)X。反推目标层:Y = α(X − Z) + Z
在网络中X → low-level feature (L),Z → high-level feature (H)
最终目标层可表示为 Y = α(L − H) + H
LRM通过 迭代优化 求解目标层。每一阶段包含两个步骤:Gradient Descent和
Proximal Mapping,因此LRM 每一层由两个模块组成:BITGD 和 IRCPM
BITGD:双向信息传递梯度下降
细节恢复视角:Y = αh(L − H) + H
去噪视角:Y = αl(H − L) + L
高层路径的梯度更新公式:
低层路径的梯度更新公式
IRCPM:交叉近端映射
BITGD 得到的 vhk 和 vlk 直接使用会出现过度去噪和细节损失的问题,因此提出 IRCPM(Image Restoration Cross-Proximal Mapping)
低层更新公式:
高层更新公式:
这部分的作用是交叉融合两条路径信息
实验分析
对比方法:
消融实验:
个人声明
本文为作者对原论文的学习笔记与心得分享,受个人学识与理解所限,文中对论文内容的解读或有不够周全之处,一切以原论文正式表述为准。本文仅用于学术交流与传播,内容均由作者独立整理完成,不代表本公众号立场。如文中所涉文字、图片等内容存在版权争议,请及时与作者联系,作者将在第一时间核实并妥善处理。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)