高频感知与空间依赖感知的遥感目标检测方法研究

2501_94432776

418人浏览 · 2026-03-19 21:49:24

2501_94432776 · 2026-03-19 21:49:24 发布

论文题目【AAAI 2025】【HS-FPN: High Frequency and Spatial Perception FPN for Tiny Object Detection】
论文作者：Zican Shi， Jing Hu, Jie Ren，Hengkang Ye, Xuyang Yuan, Yan Ouyang, Jia He ，Bo Ji,Junyu Guo
发表平台:arXiv预印本

文章目录

论文主要贡献

本文针对特征金字塔网络（FPN）在微小目标检测中存在的可用特征有限、缺乏网络关注、缺乏空间感知能力三大核心问题，提出了HS-FPN（高频与空间感知特征金字塔网络）。其核心贡献在于设计了两个创新模块：高频感知模块（HFP）通过DCT频域高通滤波从通道和空间双维度动态增强微小目标的高频细节特征；空间依赖感知模块（SDP）通过像素级交叉注意力机制建模上下层特征间的空间依赖关系，解决特征错位问题。HS-FPN整体架构与标准FPN兼容，可无缝嵌入任何需要FPN的检测模型。在AI-TOD和DOTAmini10数据集上的实验表明，Cascade R-CNN+HS-FPN相比基线FPN提升AP +3.4%，尤其在极小目标（APvt）和小目标（APt）上提升显著，验证了该方法的有效性与通用性

论文创新点

研究动机与问题揭示

本文首先系统分析了当前基于特征金字塔网络（FPN）的目标检测模型在微小目标检测任务中面临的三大核心挑战，这是提出HS-FPN方法的理论基础和研究动机

问题一：可用特征有限。微小目标在图像中仅占极少数像素，经过骨干网络的多次下采样后，在深层特征图中仅剩下少数几个像素来表示目标，导致特征响应弱，不足以支撑精确定位

问题二：缺乏网络关注。标准FPN对各层特征采用相同的处理方式（1×1卷积降维→特征融合→3×3卷积整合），没有针对微小目标特征进行特殊优化，使得微弱的目标特征响应容易被背景噪声淹没

问题三：缺乏空间感知能力。FPN通过像素级相加的方式融合上下层特征，在递归上采样过程中容易导致特征错位，微小目标的特征在上下层之间无法准确对齐，影响特征融合质量

请添加图片描述

图1：原始图像与不同DCT滤波效果对比。左上角为原始图像，目标几乎不可见；右下角为最佳滤波结果（DCT[-10,:10]），信杂比（SCR）达1.5797，目标清晰可见。

方法

高频感知模块（HFP）

针对上述问题，本文提出高频感知模块（High Frequency Perception Module, HFP），核心思想是利用微小目标在频域中表现为高频分量的特性，从通道和空间两个维度增强目标特征

高频特征生成器

HFP首先通过离散余弦变换（DCT）将空间域特征转换到频域，然后应用高通滤波器去除低频分量（代表大面积平滑背景和整体轮廓），保留高频分量（代表边缘、细节和微小目标）。滤波器的超参数α=0.25，用于控制滤波频段范围请添加图片描述

通道路径（CP）

通道路径基于高频响应动态分配通道权重，突出包含微小目标特征更多的通道。具体实现是通过全局池化获取高频响应的通道统计信息，然后通过轻量级全连接层生成通道注意力权重，与原始特征逐通道相乘

空间路径（SP）

空间路径基于高频响应生成空间掩码，引导网络注意力聚焦于微小目标所在的区域。通过卷积层将高频响应转换为空间注意力图，与原始特征逐像素相乘，增强目标区域、抑制背景区域

空间依赖感知模块（SDP）

为解决FPN缺乏空间感知能力的问题，本文提出空间依赖感知模块（Spatial Dependency Perception Module, SDP），通过像素级交叉注意力机制建模上下层特征间的空间依赖关系

像素级交叉注意力

SDP将上层特征上采样至与下层特征相同尺寸后，通过1×1卷积生成Query(Q)、Key(K)、Value(V)矩阵。与Vision Transformer（ViT）在特征块间计算注意力不同，SDP在特征块内的像素间计算注意力，学习同一空间位置上不同层级特征的依赖关系请添加图片描述

特征加权融合

通过计算像素间相似度得到注意力权重，对Value矩阵进行加权求和，输出富含高层语义信息的特征，然后与下层特征相加，实现空间对齐的特征融合请添加图片描述

HS-FPN整体架构

HS-FPN的整体架构与标准FPN保持相似，确保可无缝替换任何需要FPN的检测模型，具有良好的通用性和即插即用特性。
架构设计要点：
从骨干网络采集C2-C5四层特征
通过自上而下路径生成P2-P5特征金字塔
所有横向连接均包含HFP模块
仅P2、P3、P4层包含SDP模块（P5为顶层特征，无需空间依赖感知）
请添加图片描述
图6：HFP模块消融实验。DCT滤波（红色）在小目标检测中效果最佳（NWPU VHR-10 mAP 82.3%），梯度/拉普拉斯方法显著落后。

实验

消融实验

在AI-TOD测试集上进行消融实验，验证各模块的有效性
关键发现：
请添加图片描述

请添加图片描述
单独使用HFP提升AP +2.2，单独使用SDP提升AP +1.1
HFP+SDP组合提升AP +3.4，证明两模块具有协同效应
CP和SP组合比单独使用提升AP +0.8，证明通道与空间注意力互补

与SOTA方法对比

在AI-TOD数据集上与现有方法进行对比，Cascade R-CNN+HS-FPN相比Cascade R-CNN+FPN提升AP +3.4%，在极小目标(APvt)和小目标(APt)上提升最为显著

检测结果可视化

结论

本文针对微小目标检测任务中特征金字塔网络（FPN）存在的可用特征有限、缺乏网络关注、缺乏空间感知能力三大核心问题，提出了HS-FPN（高频与空间感知特征金字塔网络）。研究得出以下主要结论：

第一，频域分析为微小目标特征增强提供了新视角。通过DCT高通滤波实验验证，微小目标在频域中主要表现为高频分量，适度滤波（α=0.25）可显著提升目标信杂比（SCR从0.9939提升至1.5797），这为从频域角度增强微小目标特征提供了理论依据

第二，通道与空间双维度注意力具有互补效应。高频感知模块（HFP）中的通道路径（CP）和空间路径（SP）单独使用均可提升AP约1.4%，两者组合使用可提升AP 2.2%，证明通道注意力与空间注意力在微小目标特征增强上具有协同作用

第三，空间依赖建模能有效改善特征融合质量。空间依赖感知模块（SDP）通过像素级交叉注意力机制建模上下层特征间的空间依赖关系，单独使用可提升AP 1.1%，与HFP组合后整体提升AP 3.4%，验证了空间对齐对微小目标检测的重要性

第四，HS-FPN具有良好的通用性与性价比。该方法架构与标准FPN兼容，可无缝嵌入任何需要FPN的检测模型。在AI-TOD和DOTAmini10数据集上，Cascade R-CNN+HS-FPN相比基线提升AP 3.4%，尤其在极小目标（APvt）和小目标（APt）上提升显著，而计算成本仅增加FLOPs 23.5%、参数量4.0%，性能提升达16.8%，性价比合理

综上所述， HS-FPN通过频域增强与空间依赖建模的双重机制，有效解决了FPN在微小目标检测中的固有局限性，为遥感图像、安防监控等微小目标密集场景的检测任务提供了新的技术思路和实践参考

个人声明

本文为作者对原论文的学习笔记与心得分享,受个人学识与理解所限,文中对论文内容的解读或有不够周全之处,一切以原论文正式表述为准。本文仅用于学术交流与传播,如文中所涉文字、图片等内容存在版权争议,请及时与作者联系,作者将在第一时间核实并妥善处理

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

易服客工作室：如何让你的品牌出现在 AI 生成的搜索结果中？掌握 LLM 引用策略

AtomGit开源社区

AI Agent 面试题 975：多模态Agent的前沿研究和技术突破

世界模型是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在前沿研究与趋势层面实现智能化的行为和决策。在实际应用中，世界模型的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，世界模型的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan Turing 就提出了关于机器智能的基

AtomGit开源社区

AI Agent 面试题 977：Agent与人类协作的未来模式和交互范式

Agent 操作系统是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在前沿研究与趋势层面实现智能化的行为和决策。在实际应用中，Agent 操作系统的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，Agent 操作系统的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan T