一、数据集概述

在智慧农业与自动化采摘领域,果实的成熟度识别是核心技术环节之一。然而,西红柿(番茄)的成熟度检测面临多个现实痛点:

  • 成熟度划分模糊:传统人工判断依赖经验,不同人的视觉标准不统一,导致“半熟”状态难以量化。
  • 形状与大小差异大:大西红柿(牛番茄)与小西红柿(圣女果)不仅尺寸不同,其颜色变化曲线、光照反射特性也存在显著差异,单一模型难以兼顾。
  • 光照与环境干扰强:温室或大田环境下,叶片遮挡、果实阴影、光照角度变化会严重影响基于颜色与纹理的识别算法。
  • 缺乏细粒度多类别公开数据集:现有农业数据集多为“成熟/未成熟”二分类,或只针对单一品种。缺少同时区分品种(大小)3级成熟度的组合标签数据,限制了精细化目标检测算法的落地。

本数据集专门针对上述痛点进行设计,包含 800 张 真实场景图像,能够有效解决以下问题:

  • 细粒度多品种成熟度检测:支持同时识别两类番茄(大西红柿、圣女果)× 三种成熟度(绿熟、半熟、完熟),共6个类别。适合用于训练高精度目标检测模型(如YOLO、Faster R-CNN、DETR等)。
  • 跨尺度特征学习:图片中同时包含大小不一的果实,有助于模型学习尺度不变性特征,提升对密集小目标(如圣女果串)的检测能力。
  • 复杂环境下的鲁棒性训练:图像涵盖不同光照、不同遮挡程度、不同拍摄距离,数据本身带有真实农业环境的噪声,可有效提高模型在实际部署时的泛化能力。
  • 农业自动化落地支撑:该数据集可直接用于智能视觉系统、无人机作物生长监测、温室产量预估等任务,尤其适用于需要区分“半熟——适宜采摘”与“完熟——立即处理”的商业场景。

二、数据标注图片实例

该数据集通过精心设计的采集和标注流程,方便为研究学习使用。

  • 图像分辨率:1024*x 像素
  • 标注格式:Labelme JSON格式,包含对象类别和精确标注边界。
  • 类别标签体系(共6类):
品种 成熟度 英文标签 说明
大西红柿 绿色未熟 b_green 果实全绿,未进入转色期
大西红柿 半熟 b_half_ripened 果面出现粉红/橙黄区域,占比30%~70%
大西红柿 完熟 b_fully_ripened 整体呈红色或深红色,适合采摘
小西红柿(圣女果) 绿色未熟 l_green 果实全绿,硬实
小西红柿(圣女果) 半熟 l_half_ripened 局部变色,常见为橙黄带绿
小西红柿(圣女果) 完熟 l_fully_ripened 整体呈亮红或橙红色

示例如下:


在这里插入图片描述
在这里插入图片描述

三、标注工具

工具:X-AnyLabeling-CPU.exe

下载地址:https://github.com/CVHub520/X-AnyLabeling/releases

四、数据下载地址

点击下载地址


如果有用,请点个三连呗 点赞、关注、收藏
你的鼓励是我最大的动力

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐