YOLOv8水果分类检测系统(项目源码+YOLO数据集+模型权重+UI界面+python+深度学习+环境配置)
摘要
本文基于YOLOv8目标检测算法,构建了一个面向六类水果(苹果、香蕉、芒果、橘子、菠萝、西瓜)的自动分类检测系统。实验采用自建数据集,共包含1007张图像,按768:129:110划分为训练集、验证集和测试集。模型训练后,在全类别上的平均精度均值(mAP@0.5)为0.67,最佳F1值为0.67,全类别召回率最高可达0.84。各类别中,香蕉和菠萝的检测效果最佳(mAP均为0.83),芒果次之(0.82),西瓜和橘子表现一般(0.66和0.54),苹果检测效果最差(仅33%正确识别率)。混淆矩阵分析显示,模型存在较为严重的水果与背景误检问题,尤其是苹果和橘子易被误判为背景或相互混淆。实验结果表明,YOLOv8在水果检测任务中具有一定潜力,但在小样本类别和边界模糊场景下仍有较大提升空间。
引言
随着计算机视觉技术的快速发展,基于深度学习的目标检测算法在农业自动化、智能零售、食品分拣等领域的应用日益广泛。水果分类检测作为其中的典型任务,对于提升供应链效率、降低人工成本具有重要意义。然而,实际场景中水果种类多样、形态相似、光照变化及遮挡等因素,给高效准确的检测带来了挑战。
YOLO(You Only Look Once)系列算法以其优异的实时性和检测精度,成为目标检测任务的主流方法之一。其中YOLOv8在结构优化、损失函数设计及训练策略上进一步改进,具备更强的特征表达能力和更快的收敛速度。本文基于YOLOv8构建了一个面向六种常见水果的分类检测系统,旨在探索其在中小规模数据集上的检测性能。
目录
功能模块
✅ 用户登录注册:支持密码检测,密码加密。
注册

登录

✅ 图片检测:可对图片进行检测,返回检测框及类别信息。

✅参数实时调节(置信度和IoU阈值)

✅ 支持选择检测目标:可以选择一个或者多个类目的目标进行检测

✅ 视频检测:支持视频文件输入,检测视频中每一帧的情况。

✅ 摄像头实时检测:连接USB 摄像头,实现实时监测。

✅日志记录:日志标签页记录操作和错误信息,带时间戳

✅结果保存模块:支持图片/视频/摄像头检测结果保存
1、用户管理模块
| 功能 | 描述 |
|---|---|
| 用户注册 | 用户名、密码、确认密码、邮箱(选填)注册,密码SHA256加密存储 |
| 用户登录 | 用户名密码验证,自动跳转主界面 |
| 用户数据存储 | JSON文件存储用户信息(密码加密、注册时间、邮箱) |
| 登录状态 | 主界面显示当前登录用户名 |
2、界面与交互模块
| 功能 | 描述 |
|---|---|
| 玻璃效果界面 | 半透明毛玻璃背景,圆角边框,现代化视觉风格 |
| 无边框窗口 | 自定义标题栏,支持窗口拖动、最小化、最大化、关闭 |
| 响应式布局 | 主窗口三栏布局(左侧控制区、中央显示区、右侧信息区) |
| 状态栏 | 显示设备信息、模型状态、当前用户、实时时间 |
3、检测源管理模块
| 功能 | 描述 |
|---|---|
| 图片检测 | 支持JPG/JPEG/PNG/BMP格式图片载入 |
| 视频检测 | 支持MP4/AVI/MOV/MKV格式视频载入 |
| 摄像头检测 | 实时调用摄像头(默认ID 0)进行检测 |
| 检测源切换 | 下拉菜单切换三种检测模式,自动更新界面状态 |
4、检测参数配置模块
| 功能 | 描述 |
|---|---|
| 置信度阈值 | 滑动条调节(0-100%,步长1%),实时显示当前值 |
| IoU阈值 | 滑动条调节(0-100%,步长1%),实时显示当前值 |
| 类别选择 | 动态生成检测类别复选框,支持全选/取消全选 |
| 参数同步 | 参数实时同步到检测器核心 |
5、YOLO检测核心模块
| 功能 | 描述 |
|---|---|
| 模型加载 | 加载best.pt模型文件,自动检测GPU可用性,支持CPU/GPU切换 |
| 多模式检测 | 图片检测、视频检测、摄像头实时检测 |
| 检测线程 | 基于QThread的多线程处理,避免界面卡顿 |
| 检测结果 | 返回目标类别、置信度、边界框坐标 |
| FPS计算 | 实时计算处理帧率 |
| 进度反馈 | 视频处理进度条实时更新 |
6、结果显示模块
| 功能 | 描述 |
|---|---|
| 实时画面 | 中央区域显示检测结果图像(带标注框) |
| 统计信息 | 检测状态、目标数量、FPS、处理帧数实时更新 |
| 检测列表 | 右侧列表显示当前帧所有检测到的目标(类别+置信度) |
| 日志记录 | 日志标签页记录操作和错误信息,带时间戳 |
| 占位显示 | 未选择检测源时显示系统LOGO和提示文字 |
7、结果保存模块
| 功能 | 描述 |
|---|---|
| 保存开关 | 复选框控制是否保存检测结果 |
| 路径选择 | 自定义保存路径,支持图片/视频格式自动识别 |
| 自动命名 | 保存文件自动添加时间戳(detection_result_20240101_120000.jpg) |
| 视频保存 | 支持检测结果视频录制(MP4格式) |
| 手动保存 | 工具栏保存按钮可随时保存当前画面 |
| 保存反馈 | 保存成功弹窗提示,日志记录保存路径 |
8、工具栏功能
| 功能 | 描述 |
|---|---|
| 图片按钮 | 快速切换到图片检测模式并打开文件选择器 |
| 视频按钮 | 快速切换到视频检测模式并打开文件选择器 |
| 摄像头按钮 | 快速切换到摄像头检测模式 |
| 保存按钮 | 手动保存当前显示画面 |
9、辅助功能
| 功能 | 描述 |
|---|---|
| 错误处理 | 统一错误弹窗提示,日志记录错误详情 |
| 资源清理 | 检测停止时自动释放摄像头、视频文件、视频写入器资源 |
| 时间显示 | 状态栏实时显示系统时间 |
| 模型状态 | 状态栏显示模型加载状态和当前设备(CPU/GPU) |
10、数据校验模块
| 功能 | 描述 |
|---|---|
| 注册验证 | 用户名长度≥3,密码长度≥6,密码一致性检查,邮箱格式验证 |
| 协议确认 | 注册前需勾选同意用户协议 |
| 文件校验 | 模型文件存在性检查,文件大小验证(≥6MB) |
| 输入非空 | 登录/注册时必填项非空检查 |
背景
水果的自动识别与分类是智慧农业与智能物流中的关键技术环节。传统方法多依赖人工分拣或基于颜色、形状等手工特征的传统图像处理技术,存在效率低、适应性差、难以推广等缺点。近年来,深度学习尤其是卷积神经网络(CNN)的兴起,显著提升了图像分类与检测的性能。目标检测算法不仅需要判断图像中是否存在某一类水果,还需要准确定位其位置,这对实际应用如无人售货机、水果采摘机器人、质量检测系统等至关重要。
YOLO系列算法自2016年提出以来,经历了多个版本的迭代,逐步解决了小目标检测、边界框定位精度、多尺度特征融合等问题。YOLOv8作为当前较新的版本,引入了更高效的C2f模块、解耦检测头及动态标签分配策略,在保持高推理速度的同时提升了检测精度。尽管如此,水果检测任务仍面临诸多挑战:不同品种间外观相似、同一水果成熟度差异大、光照变化及背景复杂等,均可能导致误检或漏检。
因此,构建一个适用于多种水果的YOLOv8检测系统,并基于真实的训练结果分析其性能瓶颈,对于推动农业图像识别技术的落地具有重要的研究意义和实用价值。
数据集介绍
1. 类别设置
本数据集共包含6类常见水果,类别名称及对应标签如下:
-
Apple(苹果)
-
Banana(香蕉)
-
Mango(芒果)
-
Orange(橘子)
-
Pineapple(菠萝)
-
Watermelon(西瓜)
类别数量参数 nc: 6。
2. 数据集划分
总图像数量为 1007张,按约7.5:1.3:1.1的比例划分为:
| 数据集 | 图像数量 | 用途 |
|---|---|---|
| 训练集 | 768张 | 模型参数学习 |
| 验证集 | 129张 | 超参数调优与模型选择 |
| 测试集 | 110张 | 最终性能评估 |







训练过程


训练结果

总体评价
模型整体表现中等偏上,部分类别(香蕉、菠萝、芒果)识别较好
-
全类别 mAP@0.5 = 0.67
-
全类别 F1 最佳值 = 0.67(在置信度 0.487 附近)

-
全类别召回率最高 = 0.84(在置信度 0.000 时)

各类别详细分析
| 类别 | mAP@0.5 | 特点 |
|---|---|---|
| 香蕉 | 0.83 | 精度、召回平衡,误检少 |
| 菠萝 | 0.83 | 同上 |
| 芒果 | 0.82 | 基本可靠 |
| 类别 | mAP@0.5 | 问题 |
|---|---|---|
| 西瓜 | 0.66 | 召回偏低,部分被漏检或误判为背景 |
| 橘子 | 0.54 | 明显偏弱,易与芒果/苹果混淆 |
| 类别 | 问题表现 |
|---|---|
| 苹果 | 精度/召回均差,大量被误判为背景(39%)或橘子(11%) |
| 背景 | 大量水果被误判为背景,说明模型对目标边界不敏感 |
训练曲线分析(results.png)
-
box_loss / cls_loss / dfl_loss:训练和验证损失均在下降,说明模型在学习
-
precision / recall:震荡上升,最终趋于平稳
-
mAP50 / mAP50-95:仍在缓慢上升,说明模型未完全收敛,可继续训练



常用标注工具
假设您现在准备好进行标注。有几种开源工具可以帮助简化数据标注流程。以下是一些有用的开放标注工具:
Label Studio:一个灵活的工具,支持各种标注任务,并包含用于管理项目和质量控制的功能。 CVAT:一个强大的工具,支持各种标注格式和可定制的工作流程,使其适用于复杂的项目。 Labelme:一个简单易用的工具,可以快速标注带有多边形的图像,非常适合简单的任务。 LabelImg: 一款易于使用的图形图像标注工具,特别适合以 YOLO 格式创建边界框标注。

这些开源工具经济实惠,并提供一系列功能来满足不同的标注需求。
界面核心代码:

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)