【人工智能与机器人研究】基于改进YOLOv11的野外中草药目标检测
导读:
为解决野外复杂场景下中草药检测存在的小目标漏检、背景干扰大、模型计算冗余等问题,提升检测精度与效率,本文以YOLOv11为基础开展针对性改进研究。方法上,将SPPF模块替换为AIFI模块降低计算复杂度并整合全局信息;采用Dysample模块替代传统上采样,增强遮挡模糊目标的细节恢复能力;新增小目标检测层扩大尺度覆盖,同时嵌入CBAM双注意力模块抑制背景干扰、聚焦关键特征。实验表明,改进模型mAP@0.5为81.2%,较基线YOLOv11n提升2.9个百分点,GPU端FPS为266,参数量仅2.80 M,大幅提升了复杂场景下的检测精度与运行效率,为野外中草药资源的智能化识别、调查与保护提供了可靠技术支撑。
作者信息:
李江东, 于海峰, 刘怡涵:华北理工大学电气工程学院,河北 唐山;田立茹:华北理工大学中医学院,河北 唐山
论文详情
针对野外中草药检测场景,对 YOLOv11 网络结构开展针对性改进。如图 1,将SPPF模块替换为AIFI模块,通过同尺度特征间的注意力机制实现特征交互与全局信息整合,在保留叶片纹理与背景关联等长距离依赖的同时,显著降低计算复杂度与参数规模;在上采样环节,采用Dysample模块替代传统上采样结构,增强密集排列中草药在遮挡与模糊场景下的细节特征恢复能力,提升多尺度特征融合与处理效果。针对种子、小花等密集小目标,新增小目标检测层并配置高分辨率检测头,扩大模型对不同尺度 中草药的检测覆盖范围。在检测层嵌入 CBAM 双注意力模块,借助通道注意力和空间注意力聚焦关键特 征并抑制枯叶、土壤等复杂背景干扰,进一步提升复杂野外环境下的目标检测精度。

AIFI模块作为基于Transformer的轻量级全局特征提取模块,成为替代SPPF的最优选择AIFI由多头注意力机制与前馈网络(FFN)构成,结构图如图2,其中层归一化与丢弃模块用于促进网络收敛并防止过拟合。

基于 DySample 的动态上采样如图 3 所示。

网络越深,分辨率越低,小目标在特征图中像素占比极低,模型难以捕捉其有效特征。尤其在中草药检测场景中,花蕊、叶脉等细粒度小目标特征易在传递中丢失,导致漏检、定位偏差,严重影响检测精度。
为解决该问题,专门添加小目标检测层,构建四尺度检测层架构,覆盖不同尺寸目标(具体结构如图 4 所示)。

本研究选取黄芩、金银花(忍冬)、板蓝根(菘蓝)三种典型中草药作为研究对象,分别针对其发芽期、生长期、开花成熟期三个阶段,在复杂背景与密集生长场景下开展图像采集。实验采用尼康 D7200 相机进行拍摄, 以获取满足深度学习训练所需的高分辨率图像。为提升模型泛化能力与鲁棒性,对原始图像采用翻转、 缩放、裁剪、平移等几何操作进行数据增强,最终构建包含 6039 张图像的数据集。
本实验所用硬件环境与软件配置详情如表 1 所示。

由表 2 可知,基线模型 mAP@0.5 为 78.3%,单独引入 AIFI、Dysample、CBAM 任一模块后, mAP@0.5 分别提升至 79.2%、79.4%、79.3%,证明各模块均可有效增强特征提取能力;两两组合后性能进一步提升,其中 Dysample 与 CBAM 组合使 mAP@0.5 达 80.5%;当三者同时引入时,mAP@0.5 最终提升至 81.2%,较基线模型提升 2.9%,同时参数量仅小幅增加,保持了高效的实时推理性能,充分验证了 AIFI 模块、Dysample 模块、新增小目标检测层及 CBAM 双注意力机制的协同改进有效性。各模块在降低计算冗余、强化小目标与遮挡目标细节提取、抑制复杂背景干扰等方面形成互补,显著缓解漏检误检问题,使模型在野外中草药检测场景下的适配性与检测性能得到全面提升,满足野外中草药识别检测的实际应用需求。

为进一步验证所提模型在野外中草药检测任务中的优越性,本文选取 YOLOv5n、YOLOv7-tiny、 YOLOv8n、YOLOv9-t、YOLOv10n 及 YOLOv11n 等主流轻量化目标检测模型开展对比试验,见表3。

本文面向野外中草药目标检测任务,基于 YOLOv11 模型构建改进方案。首先,将 SPPF 替换为AIFI模块,在降低计算冗余的同时强化全局特征关联;其次,采用 Dysample 上采样并新增小目标检测层,提升遮挡与微小目标的细节恢复能力;最后,嵌入 CBAM 双注意力模块,抑制复杂背景干扰。消融实验表明, 单独引入各模块即可使mAP@0.5提升至79.2%~79.4%,三者协同后mAP@0.5达81.2%,较基线提升 2.9%, 参数量与计算量仅小幅增加。对比试验显示,改进模型 mAP@0.5 为 81.2%,较 YOLOv5n/YOLOv8n/YOLOv9-t 等主流模型提升 3.0%~3.3%,推理速度达 266 FPS,优于所有对比模型。兼顾精度与效率,满足野外巡检实时需求。
基金项目:
河北省自然科学基金资助(D2024209006)
河北省教育厅科学研究项目资助(QN2024147)
河北省大学生创新创业计划项目资助(S202510081014)
原文链接:
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)