YOLO26 改进、魔改｜大核可分离注意力（ LSKA ）将二维大核卷积拆成水平、垂直一维卷积级联，用更少计算与内存实现大感受野空间注意力，让 CNN 注意力模块高效用上超大核，全面提升精度与鲁棒性

一勺帅汤329

611人浏览 · 2026-03-23 10:05:34

一勺帅汤329 · 2026-03-23 10:05:34 发布

视觉注意力网络 VAN 中的大核注意力 LKA，虽能凭借超大卷积核实现长程依赖建模、性能超越部分 ViT，但其中深度卷积会随核尺寸增大，导致计算量与内存占用呈平方级增长，极大限制超大核在端侧与高分辨率任务中的落地应用。为解决 LKA 的计算冗余问题、让 CNN 注意力模块安全高效使用超大核，研究者提出大核可分离注意力 LSKA，在保留大核优势的同时，实现计算与参数量的大幅削减，兼顾长程建模、空间适应性与计算高效性。

1. LSKA 原理

LSKA 的核心是二维大核的一维可分离分解：将 LKA 中原有的二维深度卷积、膨胀深度卷积，统一拆解为级联的 1×k 水平卷积与 k×1 垂直卷积，用两次一维卷积等效替代一次二维大核卷积，把核尺寸带来的平方级复杂度降为线性级，既保留完整大感受野与长程依赖建模能力，又避免参数与计算量爆炸。同时继承 LKA 的空间注意力机制，通过 1×1 卷积生成注意力图，对特征进行自适应加权，让模型更关注物体形状、弱化纹理依赖，提升噪声与扰动下的鲁棒性。

标准 LSKA 沿用 VAN‑LKA 的基础流程，仅对大核卷积层做可分离改造，整体结构清晰、即插即用：

局部特征捕获：用 (2d−1)×1 与 1×(2d−1) 级联一维深度卷积，替代原二维小核深度卷积，提取局部特征并抵消后续膨胀卷积的网格效应。
长程依赖建模：用⌊k/d⌋×1 与 1×⌊k/d⌋级联一维膨胀深度卷积，替代原二维大核膨胀卷积，构建超大感受野、建模全局空间关联。
注意力生成与融合：经 1×1 卷积得到空间注意力图，与输入特征做哈达玛积，完成自适应特征增强；搭配批量归一化、GELU 激活与卷积前馈网络，构成完整注意力模块。
复杂度优势：相比 LKA，深度卷积层可节省 (2d−1)/2 参数，膨胀深度卷积层可节省⌊k/d⌋/2 参数，计算量同步下降，超大核下优势更显著。

2. YOLO与 LSKA 的结合

将 LSKA 嵌入 YOLO 的骨干或颈部特征融合层，可在几乎不增加推理耗时的前提下，扩大有效感受野、强化长程特征关联，显著提升小目标、密集目标与遮挡目标的检测召回率与 mAP。其轻量化结构不破坏 YOLO 的实时性优势，形状偏置还能增强模型对噪声、模糊等复杂场景的鲁棒性，让检测框更准、类别更稳。

3. LSKA 代码部分

YOLO11|YOLO12|YOLO26|改进| 全局-局部语义增强模块GLSS，过协同提取8D-SSM全局语义与局部细节特征_哔哩哔哩_bilibili

YOLO12模型改进方法，快速发论文，总有适合你的改进，还不改进上车_哔哩哔哩_bilibili

代码获取：YOLOv8_improve/YOLOV12.md at master · tgf123/YOLOv8_improve · GitHub

4. LSKA 引入到YOLO26中

第一: 先新建一个change_model，如下图如所示。

将代码复制到change_model里面

第二：在task.py中导入包

第三：在task.py中的模型配置部分下面代码

第四：将模型配置文件复制到ultralytics\cfg\models\26文件中

第五：运行代码


from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld

if __name__=="__main__":

    # 使用自己的YOLOv12.yamy文件搭建模型并加载预训练权重训练模型
    model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/models/26/yolo26_LKA_Attention.yaml")
        # .load(r'E:\Part_time_job_orders\YOLO_NEW\YOLOv12\yolo12n.pt')  # build from YAML and transfer weights

    results = model.train(data=r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/datasets/VOC_my.yaml",
                          epochs=300,
                          imgsz=640,
                          batch=32,
                          optimizer="MuSGD",
                          # cache = False,
                          # single_cls = False,  # 是否是单类别检测
                          # workers = 0,
                         # resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
                          amp = True
                          )

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

关于小土堆目标检测YOLOv5的一些报错

常见原因是：训练时使用的输入图片尺寸（例如 640×640）与当前运行 detect.py 时的输入尺寸不一致，导致特征图缩放比例变化，Anchor 的个数无法对齐。遇到的 AttributeError: Can't get attribute 'SPPF' 错误，是因为你使用的 YOLOv5 代码库版本（v5.0）较老，它所包含的models/common.py中没有定义新版本 YOLO 模型（

AtomGit开源社区

5月最新AI前端八股文，背完通过率高达90%

5 月份的面试战场已经打响。纯 Web 前端的岗位会继续萎缩，但“Web + AI”的岗位会爆发。不要等到 HR 告诉你“薪资倒挂”或者“HC 冻结”时才后悔。要么你现在就去啃 WebGPU 和端侧推理，要么等着被那些啃了的人淘汰。这话说得重，但真的是我这几天面试最真实的感受。共勉。别让你的技术栈，停在 2023 年。 🚀。

AtomGit开源社区

ICEF认知基元框架_AI内化精简版实战案例一

这一互惠共生的演化历程可以从以下几个关键阶段来理解：🗿 1. 萌芽：大灭绝前的松散合作在共生关系正式确立之前，蚂蚁和真菌之间可能存在一种偶然的、非必需的互动，这为后来的深度合作奠定了行为基础。💎 总结总而言之，蚂蚁与真菌的共生关系并非一蹴而就，而是在6600万年前的环境剧变催化下，从一个松散的、机遇性的合作开始，经过数千万年的选择压力、基因组层面的适应性演化和多物种间的复杂博弈，才最终形成了我