DEIM :采用改进匹配算法实现快速收敛的DETR(中国25年3月研究)
摘要:我们推出 DEIM ——一个创新且高效的训练框架,专为加速基于Transformer架构的实时目标检测(DETR)模型收敛而设计。为缓解DETR模型中一对一匹配(O2O)固有的稀疏监督问题, DEIM 采用了密集型O2O匹配策略:通过运用标准数据增强技术引入额外目标样本,从而提升每张图像的正样本数量。虽然密集型O2O匹配能加快收敛速度,但也会产生大量低质量匹配结果,影响模型性能。为此,我们提出匹配感知损失函数(MAL),该创新函数可优化不同质量水平下的匹配效果,显著提升密集型O2O方法的性能。在COCO数据集上的广泛实验验证了 DEIM 的有效性:与RT-DETR和D-FINE结合使用时,其不仅能持续提升性能,还能将训练时间缩短50%;尤其与RT-DETRv2配合使用时,在 NVIDIA 4090 GPU上单日训练即可实现53.2%的平均精度(AP)。此外,基于 DEIM 训练的实时模型表现优于主流实时目标检测器—— DEIM -D-FINE-L和 DEIM -D-FINE-X在 NVIDIA T4 GPU上以124帧/秒和78帧/秒的速度分别达到54.7%和56.5%的AP值,且无需额外数据支持。我们认为 DEIM 为实时目标检测领域的发展树立了新基准。相关代码及预训练模型可访问https://www.shihuahuang.cn/ DEIM /获取。
结论:本文提出了一种名为 DEIM 的方法,旨在通过优化匹配机制来加速基于DETR的实时目标检测器的收敛速度。 DEIM 将密集O2O匹配(可增加每张图像的正样本数量)与MAL(一种专为优化不同质量匹配结果、尤其能提升低质量匹配效果的新型损失函数)相结合。这种组合显著提升了训练效率,使得 DEIM 相较于YOLOv11等模型能在更少训练轮次内实现更优性能。与RT-DETR、D-FINE等当前最先进的DETR模型相比, DEIM 在检测精度和训练速度方面均展现出明显优势,且不会影响推理延迟。这些特性使 DEIM 成为适用于实时场景的高效解决方案,并具备进一步优化及应用于其他高性能检测任务的潜力。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)