YOLO26 改进、魔改| 自适应压缩-扩展块ACE,通过轻量级的渐进式空间压缩与通道扩展操作,强化 YOLO 对多尺度目标的检测能力,让模型在复杂场景下对大、中、小目标的检测精度均有提升
在各类视觉特征学习任务中,浅层特征承载着图像的边缘、轮廓、纹理等基础结构信息,是模型感知细粒度细节的关键;深层特征则蕴含高维语义信息,支撑模型完成类别判别、目标关联等高层决策,二者的有效融合是提升模型性能的核心环节。但实际应用中,浅深层特征天然存在空间分辨率与通道维度的双重不匹配,直接融合会导致特征信息冲突、冗余,甚至丢失关键结构细节;而传统特征对齐方法要么采用简单下采样 / 上采样粗暴调整分辨率,要么通过通道拼接实现维度匹配,前者易造成结构信息流失,后者会大幅增加参数量与计算成本,在超声影像、低照度图像等弱特征、模糊边界的复杂场景中,这一问题更为突出,直接导致模型对细粒度特征的感知与判别能力下降。
为破解这一行业痛点,ACE 模块作为语义 - 结构融合模块(SSFM)的核心组件被提出,其以轻量级设计为前提,针对性解决浅深层特征的维度异构问题,实现二者的精准对齐与高效融合,既保留浅层结构特征的完整性,又能让其与深层语义特征深度互补,为后续的特征学习和下游任务执行筑牢基础。


1.ACE原理
ACE 模块的核心原理围绕 “渐进式维度适配” 与 “轻量化特征融合”两大核心展开,形成 “先对齐、后融合” 的特征处理逻辑。针对浅深层特征的空间和通道差异,ACE 不采用一步式的维度调整,而是通过逐阶段的空间压缩与通道扩展 **,让浅层特征的分辨率和通道数逐步向深层专家特征靠拢,实现二者维度的精准、平滑匹配,避免一步式调整带来的特征信息剧烈损失;在完成维度全对齐后,摒弃传统冗余的通道拼接融合方式,采用逐元素相加的融合策略,让浅深层特征在特征空间中实现逐像素的信息交互,引导模型学习二者间的共享判别模式,强化结构信息与语义信息的互补性。
同时,整个过程采用深度可分离卷积与点卷积的组合设计,在保证维度对齐精度和特征信息完整性的前提下,最大限度降低计算量和参数量,实现特征处理 “精度” 与 “效率” 的双重平衡,让模块兼具高性能与轻量级的特性,可灵活嵌入各类视觉模型。

ACE 模块为串行化的线性处理结构,无复杂分支与冗余操作,整体可分为原始浅层特征输入、L 级渐进式压缩 - 扩展处理、目标通道精准映射三个核心环节,且阶段数 L 可根据不同视觉任务的特征需求灵活调整,具备极强的适配性:
-
原始特征输入:接收骨干网络不同阶段输出的浅层结构特征X0=Fi,该特征为未做任何维度调整的原始数据,完整保留了图像的边缘、轮廓等基础结构信息,是后续处理的基础;
-
渐进式压缩 - 扩展处理:这是 ACE 的核心处理环节,包含 L 个结构完全一致的串行子阶段。每个子阶段均按照 “步长为 2 的 3×3 深度可分离卷积→BN 批量归一化→ReLU 激活函数→1×1 点卷积” 的顺序执行,其中深度可分离卷积实现空间分辨率逐阶段压缩(步长 2 使特征图尺寸减半),1×1 点卷积完成通道维度逐阶段扩展(通道数按Ci=Cin×2i倍增),通过这种逐阶段处理,让浅层特征的空间与通道维度逐步适配深层特征;
-
目标通道精准映射:经过 L 级处理后,浅层特征已完成初步维度适配,此环节通过 “1×1 点卷积→BN 批量归一化→ReLU 激活函数” 的组合操作,将特征精准映射至下游任务或深层特征所需的目标通道维度Cout,最终输出维度完全对齐的浅层特征Fi′。
2. YOLO与ACE的结合
YOLO26模型的核心优势是高速推理与端到端检测,但存在过度关注深层语义特征、对浅层结构特征利用不足的问题,ACE 模块的嵌入可实现 “扬长避短”,让模型在保留高速推理优势的同时,大幅提升检测精度。首先,ACE 能弥补 YOLO 对浅层结构特征挖掘不足的缺陷,强化模型对小目标、模糊目标的细节感知能力,有效解决 YOLO 在这类目标检测中易漏检、定位不准的问题;其次,ACE 的轻量化结构与 YOLO 的高效设计理念高度契合,逐元素相加的融合方式不会增加大量参数量和计算量,嵌入后不会影响 YOLO 的实时检测性能,保障其核心优势;最后,ACE 可灵活嵌入 YOLO 的特征金字塔(FPN/PAFPN)环节,对不同尺度的特征实现精准的浅深层维度对齐与融合,强化 YOLO 对多尺度目标的检测能力,让模型在复杂场景下对大、中、小目标的检测精度均有提升,整体增强模型的场景适配性与检测鲁棒性。
3.ACE代码部分
YOLO11|YOLO12|YOLO26|改进| 自适应压缩-扩张模块ACE,实现中浅层特征与深层特征的空间尺度和通道维度的自适应精准匹配_哔哩哔哩_bilibili
YOLO12模型改进方法,快速发论文,总有适合你的改进,还不改进上车_哔哩哔哩_bilibili
代码获取:YOLOv8_improve/YOLOV12.md at master · tgf123/YOLOv8_improve · GitHub
4. ACE二次创新-ACEv2
ACEv2 核心改进:
-
完全保留原 ACE 的下采样逻辑,仅在深度卷积后插入动态通道注意力;
-
无需额外输入(仅需单个浅层特征),与原代码调用方式完全一致;
-
可通过
reduction参数控制注意力模块的轻量化程度(默认 4,越小越轻)。
5. ACE引入到YOLO26中
第一: 先新建一个change_model,如下图如所示。

将代码复制到change_model里面
第二:在task.py中导入包
第三:在task.py中的模型配置部分下面代码

第四:将模型配置文件复制到YOLOV11.YAMY文件中
第五:运行代码
from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld
if __name__=="__main__":
# 使用自己的YOLOv12.yamy文件搭建模型并加载预训练权重训练模型
model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/models/26/yolo26_ACE.yaml")
# .load(r'E:\Part_time_job_orders\YOLO_NEW\YOLOv12\yolo12n.pt') # build from YAML and transfer weights
results = model.train(data=r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/datasets/VOC_my.yaml",
epochs=300,
imgsz=640,
batch=32,
optimizer="MuSGD",
# cache = False,
# single_cls = False, # 是否是单类别检测
# workers = 0,
# resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
amp = True
)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)