YOLO26 改进、魔改｜曲率引导令牌注意力CGTA，以曲率为核心几何先验，主导特征令牌筛选与注意力聚合流程，以近线性复杂度完成高效全局特征交互，精准保留图像曲线、边缘等几何结构，实现计算效率与几何

一勺帅汤329

410人浏览 · 2026-04-13 23:25:15

一勺帅汤329 · 2026-04-13 23:25:15 发布

遥感图像超分辨率是地理测绘、变化监测等地学应用的关键技术，道路、建筑轮廓等曲线与脊线结构直接决定应用精度，却易在下采样中失真破损。传统 Transformer 全局注意力计算复杂度高，难以处理大尺寸遥感图像；现有高效注意力又未融入几何先验，无法聚焦高曲率区域、保持长线结构连贯，导致重建出现锯齿、断裂等问题。为此，作为 CGA 架构全局分支的曲率引导令牌注意力（CGTA）被提出，以曲率驱动实现轻量化全局特征交互，兼顾计算效率与曲线结构保真。

1. CGTA原理

CGTA 以曲率为核心几何先验，采用两阶段稀疏全局交互方式，既解决了传统全局注意力计算复杂的问题，又能保障长距离曲线结构的空间一致性。第一阶段通过曲率感知与可靠性融合筛选出曲线、边缘等高价值令牌，剔除背景冗余特征；第二阶段仅对少量核心令牌做混合交叉注意力计算，兼顾特征稳定性与曲线区域聚合，将计算复杂度从 O (N²) 降至近线性 O (Nk)，以极低计算成本实现曲线结构连贯与几何特征保真。

CGTA 为轻量化双阶段模块化设计，具备即插即用特性，可灵活嵌入 Transformer 与 CNN 网络，核心包含两大模块：

曲率感知令牌筛选：通过深度卷积等操作生成曲率显著图，结合可靠性图抑制噪声，依据自适应策略筛选 Top‑k 高价值令牌，高效压缩冗余特征。
混合交叉注意力融合：对全局特征生成降维查询向量，为筛选令牌生成键、值向量并做置信度门控，融合标准与曲率调制注意力完成特征聚合，输出兼顾全局关联、结构保真与计算高效的特征图。

2. YOLO与CGTA的结合

将 CGTA 融入 YOLO 检测框架，借助曲率感知令牌筛选可大幅减少大尺度遥感图像的特征计算量，提升推理速度与显存利用率，适配 YOLO 实时检测需求。同时曲率引导注意力能强化目标边缘与细长结构的特征表达，让 YOLO 更精准定位小目标、密集目标和曲线型地物，在几乎不增加计算负担的前提下，同步提升检测效率与精度。

3. CGTA 二次创新-ACGTA

多尺度曲率感知CGTA 仅用单尺度 3×3 卷积提取曲率，ACGTA 采用 3×3/5×5/7×7 多尺度深度卷积融合特征，适配遥感图像不同尺度的曲线结构。
双向注意力交互CGTA 仅使用全局交叉注意力，ACGTA 新增 Token 局部自注意力，构建全局 + 局部的双向注意力，强化曲率结构的空间关联。
曲率门控特征增强CGTA 无针对性特征加权，ACGTA 加入曲率门控模块，自适应强化高曲率关键区域、平滑背景，提升细节重建效果。
维度鲁棒性优化CGTA 的 CPE 维度变换易引发报错，ACGTA 统一维度管理逻辑，修复张量形状冲突，模块运行更稳定、兼容性更强。
精细化特征调制CGTA 仅用两组参数调制注意力，ACGTA 新增可学习参数 γ 加权局部注意力，实现更灵活的特征融合，提升网络自适应能力。

4.CGTA代码部分

YOLO11|YOLO12|YOLO26|改进| 空间 - 通道特征调制器SCFM，通过空间与通道双分支注意力协同调节，融合全局与局部特征，弥补丢失细节_哔哩哔哩_bilibili

YOLOv11模型改进讲解，教您如何修改YOLOv11_哔哩哔哩_bilibili

YOLOv11 原理+代码详细剖析_哔哩哔哩_bilibili

https://www.bilibili.com/video/BV1HnosYREZJ/?spm_id_from=333.1387.collection.video_card.click

代码获取：YOLOv8_improve/YOLOv11.md at master · tgf123/YOLOv8_improve

5. CGTA到YOLOv26中

第一: 将下面的核心代码复制到D:\model\yolov26\ultralytics\change_model路径下，如下图所示。

第二：在task.py中导入包

第三：在task.py中的模型配置部分下面代码

第四：将模型配置文件复制到YOLOV11.YAMY文件中



from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld
import torch
if __name__=="__main__":



    # 使用自己的YOLOv8.yamy文件搭建模型并加载预训练权重训练模型
    model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO11_All/ultralytics/cfg/models/11/yolo11_CGTA.yaml")\
        # .load(r'/home/tgf/tgf/yolo/model/YOLO11_All/yolo11n.pt')  # build from YAML and transfer weights

    results = model.train(data="/home/tgf/tgf/yolo/model/YOLO11_All/ultralytics/cfg/datasets/VOC_my.yaml",
                          epochs=300,
                          imgsz=640,
                          batch=4,
                          # ema=False,
                          # cache = False,
                          # single_cls = False,  # 是否是单类别检测
                          # workers = 0,
                          # resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
                          amp = False
                          )

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐