YOLO26 改进、魔改| 曲率引导令牌注意力CGTA,以曲率为核心几何先验,主导特征令牌筛选与注意力聚合流程,以近线性复杂度完成高效全局特征交互,精准保留图像曲线、边缘等几何结构,实现计算效率与几何
遥感图像超分辨率是地理测绘、变化监测等地学应用的关键技术,道路、建筑轮廓等曲线与脊线结构直接决定应用精度,却易在下采样中失真破损。传统 Transformer 全局注意力计算复杂度高,难以处理大尺寸遥感图像;现有高效注意力又未融入几何先验,无法聚焦高曲率区域、保持长线结构连贯,导致重建出现锯齿、断裂等问题。为此,作为 CGA 架构全局分支的曲率引导令牌注意力(CGTA)被提出,以曲率驱动实现轻量化全局特征交互,兼顾计算效率与曲线结构保真。


1. CGTA原理
CGTA 以曲率为核心几何先验,采用两阶段稀疏全局交互方式,既解决了传统全局注意力计算复杂的问题,又能保障长距离曲线结构的空间一致性。第一阶段通过曲率感知与可靠性融合筛选出曲线、边缘等高价值令牌,剔除背景冗余特征;第二阶段仅对少量核心令牌做混合交叉注意力计算,兼顾特征稳定性与曲线区域聚合,将计算复杂度从 O (N²) 降至近线性 O (Nk),以极低计算成本实现曲线结构连贯与几何特征保真。

CGTA 为轻量化双阶段模块化设计,具备即插即用特性,可灵活嵌入 Transformer 与 CNN 网络,核心包含两大模块:
-
曲率感知令牌筛选:通过深度卷积等操作生成曲率显著图,结合可靠性图抑制噪声,依据自适应策略筛选 Top‑k 高价值令牌,高效压缩冗余特征。
-
混合交叉注意力融合:对全局特征生成降维查询向量,为筛选令牌生成键、值向量并做置信度门控,融合标准与曲率调制注意力完成特征聚合,输出兼顾全局关联、结构保真与计算高效的特征图。
2. YOLO与CGTA的结合
将 CGTA 融入 YOLO 检测框架,借助曲率感知令牌筛选可大幅减少大尺度遥感图像的特征计算量,提升推理速度与显存利用率,适配 YOLO 实时检测需求。同时曲率引导注意力能强化目标边缘与细长结构的特征表达,让 YOLO 更精准定位小目标、密集目标和曲线型地物,在几乎不增加计算负担的前提下,同步提升检测效率与精度。
3. CGTA 二次创新-ACGTA
-
多尺度曲率感知CGTA 仅用单尺度 3×3 卷积提取曲率,ACGTA 采用 3×3/5×5/7×7 多尺度深度卷积融合特征,适配遥感图像不同尺度的曲线结构。
-
双向注意力交互CGTA 仅使用全局交叉注意力,ACGTA 新增 Token 局部自注意力,构建全局 + 局部的双向注意力,强化曲率结构的空间关联。
-
曲率门控特征增强CGTA 无针对性特征加权,ACGTA 加入曲率门控模块,自适应强化高曲率关键区域、平滑背景,提升细节重建效果。
-
维度鲁棒性优化CGTA 的 CPE 维度变换易引发报错,ACGTA 统一维度管理逻辑,修复张量形状冲突,模块运行更稳定、兼容性更强。
-
精细化特征调制CGTA 仅用两组参数调制注意力,ACGTA 新增可学习参数 γ 加权局部注意力,实现更灵活的特征融合,提升网络自适应能力。
4.CGTA代码部分
YOLO11|YOLO12|YOLO26|改进| 空间 - 通道特征调制器SCFM,通过空间与通道双分支注意力协同调节,融合全局与局部特征,弥补丢失细节_哔哩哔哩_bilibili
YOLOv11模型改进讲解,教您如何修改YOLOv11_哔哩哔哩_bilibili
YOLOv11 原理+代码 详细剖析_哔哩哔哩_bilibili
https://www.bilibili.com/video/BV1HnosYREZJ/?spm_id_from=333.1387.collection.video_card.click
代码获取:YOLOv8_improve/YOLOv11.md at master · tgf123/YOLOv8_improve
5. CGTA到YOLOv26中
第一: 将下面的核心代码复制到D:\model\yolov26\ultralytics\change_model路径下,如下图所示。

第二:在task.py中导入包

第三:在task.py中的模型配置部分下面代码
第四:将模型配置文件复制到YOLOV11.YAMY文件中
from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld
import torch
if __name__=="__main__":
# 使用自己的YOLOv8.yamy文件搭建模型并加载预训练权重训练模型
model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO11_All/ultralytics/cfg/models/11/yolo11_CGTA.yaml")\
# .load(r'/home/tgf/tgf/yolo/model/YOLO11_All/yolo11n.pt') # build from YAML and transfer weights
results = model.train(data="/home/tgf/tgf/yolo/model/YOLO11_All/ultralytics/cfg/datasets/VOC_my.yaml",
epochs=300,
imgsz=640,
batch=4,
# ema=False,
# cache = False,
# single_cls = False, # 是否是单类别检测
# workers = 0,
# resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
amp = False
)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)