遥感图像超分辨率是地理测绘、变化监测等地学应用的关键技术,道路、建筑轮廓等曲线与脊线结构直接决定应用精度,却易在下采样中失真破损。传统 Transformer 全局注意力计算复杂度高,难以处理大尺寸遥感图像;现有高效注意力又未融入几何先验,无法聚焦高曲率区域、保持长线结构连贯,导致重建出现锯齿、断裂等问题。为此,作为 CGA 架构全局分支的曲率引导令牌注意力(CGTA)被提出,以曲率驱动实现轻量化全局特征交互,兼顾计算效率与曲线结构保真。

基础模型
改进后的

1. CGTA原理

       CGTA 以曲率为核心几何先验,采用两阶段稀疏全局交互方式,既解决了传统全局注意力计算复杂的问题,又能保障长距离曲线结构的空间一致性。第一阶段通过曲率感知与可靠性融合筛选出曲线、边缘等高价值令牌,剔除背景冗余特征;第二阶段仅对少量核心令牌做混合交叉注意力计算,兼顾特征稳定性与曲线区域聚合,将计算复杂度从 O (N²) 降至近线性 O (Nk),以极低计算成本实现曲线结构连贯与几何特征保真。

CGTA 为轻量化双阶段模块化设计,具备即插即用特性,可灵活嵌入 Transformer 与 CNN 网络,核心包含两大模块:

  1. 曲率感知令牌筛选:通过深度卷积等操作生成曲率显著图,结合可靠性图抑制噪声,依据自适应策略筛选 Top‑k 高价值令牌,高效压缩冗余特征。

  2. 混合交叉注意力融合:对全局特征生成降维查询向量,为筛选令牌生成键、值向量并做置信度门控,融合标准与曲率调制注意力完成特征聚合,输出兼顾全局关联、结构保真与计算高效的特征图。

2. YOLO与CGTA的结合   

        将 CGTA 融入 YOLO 检测框架,借助曲率感知令牌筛选可大幅减少大尺度遥感图像的特征计算量,提升推理速度与显存利用率,适配 YOLO 实时检测需求。同时曲率引导注意力能强化目标边缘与细长结构的特征表达,让 YOLO 更精准定位小目标、密集目标和曲线型地物,在几乎不增加计算负担的前提下,同步提升检测效率与精度。

3. CGTA 二次创新-ACGTA 

  1. 多尺度曲率感知CGTA 仅用单尺度 3×3 卷积提取曲率,ACGTA 采用 3×3/5×5/7×7 多尺度深度卷积融合特征,适配遥感图像不同尺度的曲线结构。

  2. 双向注意力交互CGTA 仅使用全局交叉注意力,ACGTA 新增 Token 局部自注意力,构建全局 + 局部的双向注意力,强化曲率结构的空间关联。

  3. 曲率门控特征增强CGTA 无针对性特征加权,ACGTA 加入曲率门控模块,自适应强化高曲率关键区域、平滑背景,提升细节重建效果。

  4. 维度鲁棒性优化CGTA 的 CPE 维度变换易引发报错,ACGTA 统一维度管理逻辑,修复张量形状冲突,模块运行更稳定、兼容性更强。

  5. 精细化特征调制CGTA 仅用两组参数调制注意力,ACGTA 新增可学习参数 γ 加权局部注意力,实现更灵活的特征融合,提升网络自适应能力。

4.CGTA代码部分

YOLO11|YOLO12|YOLO26|改进| 空间 - 通道特征调制器SCFM,通过空间与通道双分支注意力协同调节,融合全局与局部特征,弥补丢失细节_哔哩哔哩_bilibili

YOLOv11模型改进讲解,教您如何修改YOLOv11_哔哩哔哩_bilibili

YOLOv11 原理+代码 详细剖析_哔哩哔哩_bilibili

https://www.bilibili.com/video/BV1HnosYREZJ/?spm_id_from=333.1387.collection.video_card.click

 代码获取:YOLOv8_improve/YOLOv11.md at master · tgf123/YOLOv8_improve

5. CGTA到YOLOv26中

第一: 将下面的核心代码复制到D:\model\yolov26\ultralytics\change_model路径下,如下图所示。

            ​​​​​​         

​       

第二:在task.py中导入

 ​​​                          

​    

第三:在task.py中的模型配置部分下面代码

                                  ​     ​

第四:将模型配置文件复制到YOLOV11.YAMY文件中

         ​​​​​​​ ​​​​​​​​​​​​​​ ​​​​​​​​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​        



from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld
import torch
if __name__=="__main__":



    # 使用自己的YOLOv8.yamy文件搭建模型并加载预训练权重训练模型
    model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO11_All/ultralytics/cfg/models/11/yolo11_CGTA.yaml")\
        # .load(r'/home/tgf/tgf/yolo/model/YOLO11_All/yolo11n.pt')  # build from YAML and transfer weights

    results = model.train(data="/home/tgf/tgf/yolo/model/YOLO11_All/ultralytics/cfg/datasets/VOC_my.yaml",
                          epochs=300,
                          imgsz=640,
                          batch=4,
                          # ema=False,
                          # cache = False,
                          # single_cls = False,  # 是否是单类别检测
                          # workers = 0,
                          # resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
                          amp = False
                          )

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐