数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)

一、数据集概述

在草莓成熟度视觉识别任务中,图像分类是许多智能系统的基础环节,例如传送带分选、单个果实分级、手持设备拍照判定等。然而,当前领域仍面临以下突出痛点:

  • 类别极度不平衡问题普遍存在:在实际农业场景中,半熟草莓的窗口期极短,采集难度大,导致大多数公开数据集呈现“未熟与完熟样本多、半熟样本稀缺”的分布,模型容易忽略半熟类别或将其错误归入相邻类别。
  • 成熟度过渡状态的视觉歧义性:半熟草莓的外观变化极为连续——同一颗草莓在不同光照、不同角度下可能呈现从粉白到浅红的多种表现,不同标注人员对“半熟”边界的认定差异可达30%以上,导致训练数据标注一致性欠佳。
  • 跨场景泛化能力差:许多分类数据集在单一光照、单一品种下采集,模型一旦部署到不同大棚、不同品种或不同季节的草莓上,准确率显著下降。
  • 细粒度分类难度被低估:草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)之间的差异本质上属于细粒度视觉分类,通用分类模型(如ResNet)直接应用容易混淆半熟与完熟的边界,需要针对性设计。

该数据集能够有效解决以下问题:

  • 真实不平衡场景下的分类建模:本数据集还原了农业实际采集中的天然不平衡分布(未熟最多、完熟次之、半熟最少)。
  • 轻量级分类模型部署验证:1,623张图片的规模适中,适合快速训练 YOLO、MobileNet、EfficientNet-Lite、RepVGG 等轻量模型,为边缘设备(如手机、草莓分选机嵌入式系统)提供可行性验证。

二、数据标注图片实例

该数据集通过精心设计的采集和标注流程,方便为研究学习使用。

图像分辨率:224x224 像素

本数据集共包含 1,623 张 草莓果实图像,类别分布如下:

类别 英文标签 图片数量
未熟 unripe 923
半熟 semi-ripe 217
成熟 fully-ripe 483

1. 未熟unripe

果实整体呈白色、浅绿色或青色
在这里插入图片描述

2. 半熟semi-ripe

果面出现粉红或浅红色区域,红色占比 30%~70%,仍可见白/绿色区域

在这里插入图片描述

3. 成熟fully-ripe

果实整体呈鲜红色或深红色,红色占比 > 90%,表面有光泽
在这里插入图片描述

三、标注工具

工具:X-AnyLabeling-CPU.exe

下载地址:https://github.com/CVHub520/X-AnyLabeling/releases

四、数据下载地址

下载地址:https://download.csdn.net/download/qq_21386397/92858670


如果有用,请点个三连呗 点赞、关注、收藏
你的鼓励是我最大的动力

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐