YOLO26 改进、魔改|大核可分离注意力( LSKA )将二维大核卷积拆成水平、垂直一维卷积级联,用更少计算与内存实现大感受野空间注意力,让 CNN 注意力模块高效用上超大核,全面提升精度与鲁棒性
视觉注意力网络 VAN 中的大核注意力 LKA,虽能凭借超大卷积核实现长程依赖建模、性能超越部分 ViT,但其中深度卷积会随核尺寸增大,导致计算量与内存占用呈平方级增长,极大限制超大核在端侧与高分辨率任务中的落地应用。为解决 LKA 的计算冗余问题、让 CNN 注意力模块安全高效使用超大核,研究者提出大核可分离注意力 LSKA,在保留大核优势的同时,实现计算与参数量的大幅削减,兼顾长程建模、空间适应性与计算高效性。


1. LSKA 原理
LSKA 的核心是二维大核的一维可分离分解:将 LKA 中原有的二维深度卷积、膨胀深度卷积,统一拆解为级联的 1×k 水平卷积与 k×1 垂直卷积,用两次一维卷积等效替代一次二维大核卷积,把核尺寸带来的平方级复杂度降为线性级,既保留完整大感受野与长程依赖建模能力,又避免参数与计算量爆炸。同时继承 LKA 的空间注意力机制,通过 1×1 卷积生成注意力图,对特征进行自适应加权,让模型更关注物体形状、弱化纹理依赖,提升噪声与扰动下的鲁棒性。

标准 LSKA 沿用 VAN‑LKA 的基础流程,仅对大核卷积层做可分离改造,整体结构清晰、即插即用:
-
局部特征捕获:用 (2d−1)×1 与 1×(2d−1) 级联一维深度卷积,替代原二维小核深度卷积,提取局部特征并抵消后续膨胀卷积的网格效应。
-
长程依赖建模:用⌊k/d⌋×1 与 1×⌊k/d⌋级联一维膨胀深度卷积,替代原二维大核膨胀卷积,构建超大感受野、建模全局空间关联。
-
注意力生成与融合:经 1×1 卷积得到空间注意力图,与输入特征做哈达玛积,完成自适应特征增强;搭配批量归一化、GELU 激活与卷积前馈网络,构成完整注意力模块。
-
复杂度优势:相比 LKA,深度卷积层可节省 (2d−1)/2 参数,膨胀深度卷积层可节省⌊k/d⌋/2 参数,计算量同步下降,超大核下优势更显著。
2. YOLO与 LSKA 的结合
将 LSKA 嵌入 YOLO 的骨干或颈部特征融合层,可在几乎不增加推理耗时的前提下,扩大有效感受野、强化长程特征关联,显著提升小目标、密集目标与遮挡目标的检测召回率与 mAP。其轻量化结构不破坏 YOLO 的实时性优势,形状偏置还能增强模型对噪声、模糊等复杂场景的鲁棒性,让检测框更准、类别更稳。
3. LSKA 代码部分
YOLO11|YOLO12|YOLO26|改进| 全局-局部语义增强模块GLSS,过协同提取8D-SSM全局语义与局部细节特征_哔哩哔哩_bilibili
YOLO12模型改进方法,快速发论文,总有适合你的改进,还不改进上车_哔哩哔哩_bilibili
代码获取:YOLOv8_improve/YOLOV12.md at master · tgf123/YOLOv8_improve · GitHub
4. LSKA 引入到YOLO26中
第一: 先新建一个change_model,如下图如所示。
将代码复制到change_model里面
第二:在task.py中导入包
第三:在task.py中的模型配置部分下面代码
第四:将模型配置文件复制到ultralytics\cfg\models\26文件中
第五:运行代码
from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld
if __name__=="__main__":
# 使用自己的YOLOv12.yamy文件搭建模型并加载预训练权重训练模型
model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/models/26/yolo26_LKA_Attention.yaml")
# .load(r'E:\Part_time_job_orders\YOLO_NEW\YOLOv12\yolo12n.pt') # build from YAML and transfer weights
results = model.train(data=r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/datasets/VOC_my.yaml",
epochs=300,
imgsz=640,
batch=32,
optimizer="MuSGD",
# cache = False,
# single_cls = False, # 是否是单类别检测
# workers = 0,
# resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
amp = True
)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)