数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)
·
数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)
一、数据集概述
在草莓成熟度视觉识别任务中,图像分类是许多智能系统的基础环节,例如传送带分选、单个果实分级、手持设备拍照判定等。然而,当前领域仍面临以下突出痛点:
- 类别极度不平衡问题普遍存在:在实际农业场景中,半熟草莓的窗口期极短,采集难度大,导致大多数公开数据集呈现“未熟与完熟样本多、半熟样本稀缺”的分布,模型容易忽略半熟类别或将其错误归入相邻类别。
- 成熟度过渡状态的视觉歧义性:半熟草莓的外观变化极为连续——同一颗草莓在不同光照、不同角度下可能呈现从粉白到浅红的多种表现,不同标注人员对“半熟”边界的认定差异可达30%以上,导致训练数据标注一致性欠佳。
- 跨场景泛化能力差:许多分类数据集在单一光照、单一品种下采集,模型一旦部署到不同大棚、不同品种或不同季节的草莓上,准确率显著下降。
- 细粒度分类难度被低估:草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)之间的差异本质上属于细粒度视觉分类,通用分类模型(如ResNet)直接应用容易混淆半熟与完熟的边界,需要针对性设计。
该数据集能够有效解决以下问题:
- 真实不平衡场景下的分类建模:本数据集还原了农业实际采集中的天然不平衡分布(未熟最多、完熟次之、半熟最少)。
- 轻量级分类模型部署验证:1,623张图片的规模适中,适合快速训练 YOLO、MobileNet、EfficientNet-Lite、RepVGG 等轻量模型,为边缘设备(如手机、草莓分选机嵌入式系统)提供可行性验证。
二、数据标注图片实例
该数据集通过精心设计的采集和标注流程,方便为研究学习使用。
图像分辨率:224x224 像素
本数据集共包含 1,623 张 草莓果实图像,类别分布如下:
| 类别 | 英文标签 | 图片数量 |
|---|---|---|
| 未熟 | unripe | 923 |
| 半熟 | semi-ripe | 217 |
| 成熟 | fully-ripe | 483 |
1. 未熟unripe
果实整体呈白色、浅绿色或青色
2. 半熟semi-ripe
果面出现粉红或浅红色区域,红色占比 30%~70%,仍可见白/绿色区域

3. 成熟fully-ripe
果实整体呈鲜红色或深红色,红色占比 > 90%,表面有光泽
三、标注工具
工具:X-AnyLabeling-CPU.exe
下载地址:https://github.com/CVHub520/X-AnyLabeling/releases
四、数据下载地址
下载地址:https://download.csdn.net/download/qq_21386397/92858670
如果有用,请点个三连呗 点赞、关注、收藏。
你的鼓励是我最大的动力
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)