目录

1.小目标检测介绍

1.1 小目标定义

1.2 难点

2.小目标难点解决方案

2.1注意力提升小目标检测精度

2.1.1 上下文信息CAM

2.1.2 ConvNeXt

 2.1.3 ECVBlock

 2.1.4 多头上下文集成(Context Aggregation)的广义构建模块

 2.2 多头检测头

2.3 loss优化

2.3.1 Wasserstein Distance Loss

 3.未完待续

1.小目标检测介绍

1.1 小目标定义

1)以物体检测领域的通用数据集COCO物体定义为例,小目标是指小于32×32个像素点(中物体是指32*32-96*96,大物体是指大于96*96);
2)在实际应用场景中,通常更倾向于使用相对于原图的比例来定义:物体标注框的长宽乘积,除以整个图像的长宽乘积,再开根号,如果结果小于3%,就称之为小目标;

1.2 难点

1)包含小目标的样本数量较少,这样潜在的让目标检测模型更关注中大目标的检测;

2)由小目标覆盖的区域更小,这样小目标的位置会缺少多样性。我们推测这使得小目标检测的在验证时的通用性变得很难;

2.小目标难点解决方案

主要通过数据优化(如涂鸦式数据增强、mosaic增强)、网络优化、注意力机制、loss优化等;

2.1注意力提升小目标检测精度

2.1.1 上下文信息CAM

        由于分辨率低、体积小,微小物体很难被探测到。微小目标检测性能差的主要原因是网络的局限性和训练数据集的不平衡性。本文提出了一种新的特征金字塔网络,将上下文增强和特征细化相结合。将多尺度扩展卷积得到的特征进行融合,并自上而下注入特征金字塔网络,以补充上下文信息。在多尺度特征融合中,引入通道和空间特征细化机制来抑制冲突形成,防止微小物体被淹没在冲突信息中。此外,还提出了一种称为复制-减少-粘贴的数据增强方法,该方法可以增加微小对象在训练过程中对漏检的贡献,从而确保训练更加均衡。

 基于Yolov5/Yolov7微小目标检测---上下文信息CAM,微小目标涨点明显_AI小怪兽的博客-CSDN博客

2.1.2 ConvNeXt

涨点神器:Yolov5/Yolov7加入ConvNeXt提升小目标检测能力,适用yolo各个系列_AI小怪兽的博客-CSDN博客

 2.1.3 ECVBlock

基于YoloV5的CFPNet---ECVBlock的小目标检测,即插即用,助力检测涨点_AI小怪兽的博客-CSDN博客  提出的EVC主要由两个并行连接的块组成,其中使用轻量级MLP来捕获顶级特征的全局长期依赖性(即全局信息)。

 2.1.4 多头上下文集成(Context Aggregation)的广义构建模块

Yolov5涨点神器:注意力机制---多头上下文集成(Context Aggregation)的广义构建模块,助力小目标检测,暴力涨点_AI小怪兽的博客-CSDN博客

 2.2 多头检测头

YOLOv5有3个检测头,能够多尺度对目标进行检测,但对微小目标检测可能存在检测能力不佳的现象,因此添加一个微小物体的检测头,能够大量涨点,map提升明显;

涨点技巧:基于Yolov5的微小目标检测,多头检测头提升小目标检测精度_yolov5增加检测头_AI小怪兽的博客-CSDN博客

2.3 loss优化

2.3.1 Wasserstein Distance Loss

 Yolov7/Yolov5损失函数改进:Wasserstein Distance Loss,助力小目标涨点_AI小怪兽的博客-CSDN博客

1)分析了 IoU 对微小物体位置偏差的敏感性,并提出 NWD 作为衡量两个边界框之间相似性的更好指标;

2)通过将NWD 应用于基于锚的检测器中的标签分配、NMS 和损失函数来设计强大的微小物体检测器;

3)提出的 NWD 可以显着提高流行的基于锚的检测器的 TOD 性能,它在 AI-TOD 数据集上的 Faster R-CNN 上实现了从 11.1% 到 17.6% 的性能提升;

Wasserstein distance的主要优点是

  1. 无论小目标之间有没有重叠都可以度量分布相似性;
  2. NWD对不同尺度的目标不敏感,更适合测量小目标之间的相似性。

 3.未完待续

GitHub 加速计划 / yo / yolov5
49.44 K
16.03 K
下载
yolov5 - Ultralytics YOLOv8的前身,是一个用于目标检测、图像分割和图像分类任务的先进模型。
最近提交(Master分支:3 个月前 )
79b7336f * Update Integrations table Signed-off-by: Glenn Jocher <glenn.jocher@ultralytics.com> * Update README.md Signed-off-by: Glenn Jocher <glenn.jocher@ultralytics.com> * Update README.zh-CN.md Signed-off-by: Glenn Jocher <glenn.jocher@ultralytics.com> --------- Signed-off-by: Glenn Jocher <glenn.jocher@ultralytics.com> 1 个月前
94a62456 * fix: quad training * fix: quad training in segmentation 1 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐