猪的危险行为数据集（5000+高清标注）| YOLO实战智慧养殖与异常行为预警

一键难忘

117人浏览 · 2026-03-25 20:46:08

一键难忘 · 2026-03-25 20:46:08 发布

猪的危险行为数据集（5000+高清标注）| YOLO实战智慧养殖与异常行为预警

摘要

在规模化生猪养殖过程中，猪只间的危险行为（如攻击、咬耳朵、咬尾巴）是导致猪只受伤、感染甚至死亡的重要诱因，每年给养殖业造成巨大的经济损失。如何及时发现并干预这些危险行为，已成为智慧养殖领域亟待解决的核心问题。本文正式开源一套针对生猪危险行为识别的高质量标注数据集，总计包含5000余条精准标注样本，聚焦三类典型危险行为：攻击行为、咬耳朵、咬尾巴。数据集由专业养殖人员与计算机视觉工程师联合标注，标注准确率高达98%以上，严格按照7:1.5:1.5的比例划分为训练集、验证集与测试集，完美兼容YOLO系列目标检测框架。本文将详细介绍数据集的构建背景、类别定义、标注规范、质量保障措施以及基于YOLOv8的训练实战心得，希望能为从事智慧养殖、动物行为监测领域的研究者与开发者提供一份有价值的参考。
在这里插入图片描述

一、引言：生猪养殖中的危险行为与防控挑战

1.1 危险行为的危害

在规模化生猪养殖中，猪只间的危险行为是长期困扰养殖户的顽疾。据统计，由猪只攻击、撕咬行为造成的损失约占养殖总损失的5%-10%。具体而言：

攻击行为：猪只之间的主动冲撞、撕咬不仅会造成直接的身体伤害，还会引发群体应激反应，影响整体生长性能；
咬耳朵：针对性撕咬耳朵的行为极易导致耳部感染、溃烂，严重时甚至造成耳部残缺，影响猪只外观和健康；
咬尾巴：咬尾巴是生猪养殖中最典型的异常行为之一，轻则造成尾部创伤，重则引发脊髓感染、败血症，甚至导致死亡。

这些危险行为的成因复杂，涉及饲养密度、饲料营养、环境应激、个体健康状态等多方面因素。而最有效的防控手段，正是实时监测、早期预警、及时干预。

数据集下载

通过网盘分享的文件：猪的危险行为数据集
链接: https://pan.baidu.com/s/1p6Gx0ilMBTbf8yYoTBujcg?pwd=m8jf
提取码: m8jf

在这里插入图片描述

1.2 传统监测方式的局限性

目前，大多数养殖场仍依赖人工巡栏来发现危险行为。然而，这种方式存在明显短板：

人力成本高：规模化猪场动辄上千头猪，人工巡栏费时费力；
发现滞后：危险行为往往发生在瞬间，人工巡查难以捕捉；
主观性强：不同饲养员对危险行为的判断标准不一，难以形成量化数据。

1.3 AI视觉监测的解决方案

随着计算机视觉技术的发展，基于AI的猪只行为监测成为可能。通过部署智能摄像头和深度学习算法，可以实现：

7×24小时不间断监测，不放过任何异常行为；
秒级响应，第一时间发出预警；
量化评估，为精细化管理提供数据支撑。

而这一切的基础，正是一套高质量、多场景、标注精准的猪危险行为数据集。

二、数据集概述

2.1 数据集基本信息

项目	说明
数据集名称	猪的危险行为数据集
样本总量	5000+条高质量标注样本
标注格式	YOLO格式（*.txt），兼容YOLOv5/v8/v11等主流框架
类别数量	3类猪的危险行为（nc: 3）
数据划分	训练集（70%）/验证集（15%）/测试集（15%）
存储路径	`database/猪的危险行为数据集`
标注准确率	≥98%（经专业养殖人员与视觉工程师联合标注）

2.2 数据集结构

数据集采用标准的机器学习数据集组织规范，路径规划清晰，便于模型快速加载：

database/
└── 猪的危险行为数据集/
    ├── train/
    │   ├── images/          # 训练集图片（约3500张）
    │   └── labels/          # 训练集标注文件
    ├── valid/
    │   ├── images/          # 验证集图片（约750张）
    │   └── labels/          # 验证集标注文件
    └── test/
        ├── images/          # 测试集图片（约750张）
        └── labels/          # 测试集标注文件

每个子目录下，图像文件与标注文件一一对应（相同文件名，不同扩展名），符合YOLO系列框架的标准加载方式。

2.3 数据来源与多样性

样本采集自国内不同规模的标准化生猪养殖场，覆盖多个维度，确保数据的多样性和场景泛化性：

维度	覆盖范围
品种	大白猪、长白猪、杜洛克猪及其杂交后代
生长阶段	保育猪（断奶-30kg）、育肥猪（30kg-出栏）
养殖环境	栏舍（水泥地、漏粪板）、运动场
光照条件	白天自然光、夜间人工照明、红外补光
密度条件	低密度（<5头/栏）、中密度（5-10头/栏）、高密度（>10头/栏）

三、类别定义与标注规范

3.1 三类危险行为详解

数据集聚焦生猪养殖中最具危害性的三类危险行为，每类行为都有明确的定义和视觉特征：

类别编号	中文名称	英文名称	行为定义	视觉特征	养殖危害
0	攻击行为	Aggressive	猪只间的主动攻击行为，如冲撞、撕咬身体等	身体前冲，头部撞击或撕咬对方身体躯干，姿态激烈	造成身体创伤、群体应激、生长迟缓
1	咬耳朵	Ear biting	针对性撕咬其他猪只耳朵的行为	嘴部含住对方耳朵，头部用力撕扯，常伴有血液渗出	耳部感染、溃烂、耳部残缺
2	咬尾巴	Tail biting	针对性撕咬其他猪只尾巴的行为	嘴部含住对方尾巴，持续撕咬，尾部出血或残缺	尾部创伤、脊髓感染、败血症甚至死亡

3.2 行为判定的专业性

这三类行为的判定并非简单的视觉分类，而是需要结合养殖专业知识：

攻击行为 vs. 玩耍行为：猪只在玩耍时也可能出现追逐、轻咬，但力度温和、姿态放松。而攻击行为姿态激烈、力度大、持续时间长，且有明显的应激反应（如被攻击猪只尖叫、逃跑）。
咬耳朵/尾巴 vs. 正常探索：正常探索时，猪只只是用鼻子拱蹭、轻嗅，不会用力撕咬。而危险行为表现为持续的、用力的撕扯，常导致组织损伤。

正是因为有专业养殖人员参与标注，才能确保类别判定的准确性和业务相关性。

3.3 标注格式与技术规范

数据集采用YOLO系列算法标准标注格式，每个txt标注文件对应一张图像，每行标注内容格式为：

<class_id> <x_center> <y_center> <width> <height>

其中：

class_id：类别编号（0、1、2）
x_center, y_center：目标框中心点的归一化坐标（0-1）
width, height：目标框的归一化宽度和高度（0-1）

坐标计算方式：

x_center = (x_min + x_max) / 2 / image_width
y_center = (y_min + y_max) / 2 / image_height
width = (x_max - x_min) / image_width
height = (y_max - y_min) / image_height

所有坐标和尺寸均为归一化值，基于图像原始分辨率计算，确保标注数据可直接适配YOLO等主流检测框架，无需任何格式转换。

3.4 标注边界框要求

为了确保模型学习的有效性，标注时对边界框有严格要求：

贴合目标：边界框必须紧密贴合参与危险行为的猪只身体区域，特别是头部和嘴部（行为发生的核心部位）；
完整包含：对于攻击行为，需框选发起攻击的猪只；对于咬耳朵/尾巴，需框选撕咬者与被咬部位的交互区域；
精度控制：边界框偏移误差≤2个像素，确保标注质量达到工业级标准。

四、数据质量保障

4.1 交叉标注机制

为了确保标注的一致性和准确性，所有样本均采用双人交叉标注机制：

独立标注：两名标注人员分别独立完成同一批样本的标注；
差异比对：对比两人标注结果，标注不一致的样本进入审核流程；
分歧仲裁：养殖专家对分歧样本进行最终判定，确保类别标注无歧义。

4.2 专家审核环节

养殖专家在审核过程中主要把关以下几点：

行为类别是否正确：是否将玩耍误判为攻击，是否将探索误判为撕咬；
标注框是否准确：框选区域是否覆盖行为发生的核心部位；
边界是否清晰：对于模糊边界行为，根据养殖专业知识做出权威判定。

4.3 数据清洗

所有样本在纳入数据集前，都经过了严格的清洗流程：

剔除模糊图片：运动模糊、对焦不准的图片已被剔除；
剔除重复样本：去除高度相似或完全重复的图片；
剔除无效样本：无有效行为目标或目标被完全遮挡的图片已被剔除。

最终，有效样本占比100%，确保每一张图片、每一条标注都能为模型训练贡献价值。

4.4 标注准确率

经过交叉标注+专家审核的多重保障，数据集整体标注准确率≥98%，达到工业级模型训练的高标准要求。

五、适用场景

这套数据集不仅是学术研究的优质素材，更具备广泛的产业应用价值：

5.1 智能养殖监控系统

基于本数据集训练的模型，可部署于养殖场智能监控系统，实现以下功能：

实时预警：检测到危险行为时，立即推送告警信息至饲养员手机端；
事件记录：自动记录危险行为发生的时间、位置、涉及猪只，形成行为档案；
趋势分析：统计危险行为发生频率，分析时空分布规律，为管理决策提供数据支持。

5.2 动物福利评估

危险行为的频次是评估猪群福利水平的重要指标。通过长期监测，可以：

量化评估不同饲养密度、环境条件对猪只福利的影响；
为动物福利认证提供数据支撑；
优化养殖环境，减少危险行为发生。

5.3 精细化管理决策

基于危险行为数据，可以实现更精细化的养殖管理：

分群管理：将频繁攻击的猪只单独饲养，减少群体伤害；
环境优化：当危险行为频次异常增加时，检查饲养密度、通风条件、饲料营养等因素；
健康预警：危险行为增多往往与群体健康状态有关，可作为健康监测的辅助指标。

5.4 计算机视觉科研与教学

本数据集结构规范、标注精准、类别清晰，非常适合作为目标检测算法在农业场景的研究素材。可用于：

目标检测算法的性能验证与对比；
小样本学习、弱监督学习等前沿算法的探索；
智慧农业相关课程的教学实践。

六、基于YOLOv8的训练实战心得

在实际使用本数据集训练YOLOv8模型的过程中，我积累了一些经验，希望能帮助大家少走弯路。

6.1 训练环境配置

框架：Ultralytics YOLOv8
硬件：NVIDIA RTX 3070（8GB显存）
训练参数：
- epochs: 150
- batch-size: 16（8GB显存下的安全值）
- imgsz: 640
- optimizer: AdamW
- lr0: 0.001
- weight_decay: 0.0005

6.2 数据增强策略

考虑到养殖场景的复杂性以及危险行为识别的特殊性，我启用了以下数据增强策略：

augmentation:
  hsv_h: 0.015   # 色调扰动（应对不同光照条件）
  hsv_s: 0.7     # 饱和度扰动
  hsv_v: 0.4     # 明度扰动（增强光照泛化能力）
  degrees: 5.0   # 小角度旋转
  translate: 0.1 # 平移
  scale: 0.5     # 缩放
  flipud: 0.0    # 垂直翻转（关闭，养殖场景中不会出现倒置）
  fliplr: 0.5    # 水平翻转
  mosaic: 1.0    # 马赛克增强
  mixup: 0.2     # 混合增强

特别说明：

危险行为样本相对稀缺，Mosaic增强可以组合多个样本，有效提升数据利用率；
养殖场光线变化大，HSV扰动对于提升模型的光照泛化能力至关重要。

6.3 关键心得总结

样本不均衡处理：在三类行为中，“咬尾巴”的样本量相对较少（占比约25%），而“攻击行为”样本量最多（约45%）。为了解决不均衡问题，我采取了以下措施：
- 启用了class_weight参数，对“咬尾巴”类别赋予更高的损失权重；
- 对“咬尾巴”样本进行了数据增强过采样（复制并应用随机增强）；
- 调整了cls_loss系数，从默认的0.5提升至0.8。
小目标检测优化：危险行为发生区域（如咬耳朵、咬尾巴）在整张图片中占比较小，属于小目标检测范畴。通过将输入分辨率从640提升到768，并启用了multi-scale训练（每10个epoch随机调整输入尺寸），显著改善了小目标的检测效果。最终“咬耳朵”和“咬尾巴”的mAP分别提升了8%和10%。
遮挡场景处理：在密集养殖场景中，危险行为往往发生在猪群拥挤的区域，遮挡严重。通过增加Mosaic增强的比例，模型学会了利用可见的身体部位推断被遮挡的目标，在遮挡场景下的召回率提升了约6个百分点。
时序信息的价值：单帧检测存在一定的误检率（如将快速运动的猪只误判为攻击）。在实际部署中，建议结合时序信息——连续3-5帧检测到同一危险行为才触发告警。这种后处理策略可以将误报率降低约70%。
夜间场景适配：数据集包含约30%的夜间红外图像，与白天可见光图像特征差异较大。建议在训练时保持两类样本的平衡，并在数据增强中增加曝光度扰动，提升模型的跨光照泛化能力。训练完成后，可分别评估模型在白天和夜间场景的性能，必要时可训练两个专用模型并切换使用。

6.4 训练结果参考

在150个epochs的训练后，模型在测试集上取得了以下指标：

类别	Precision	Recall	mAP@0.5	mAP@0.5:0.95
攻击行为（Aggressive）	0.892	0.871	0.916	0.683
咬耳朵（Ear biting）	0.867	0.843	0.887	0.645
咬尾巴（Tail biting）	0.851	0.828	0.872	0.632
平均值	0.870	0.847	0.892	0.653

从结果来看，模型对“攻击行为”的识别效果最佳，这与该类别的姿态特征明显、样本量充足有关；“咬尾巴”由于目标小、样本相对稀缺，精度略低于其他类别，但仍满足实际应用需求。

七、数据获取与使用说明

7.1 下载链接

本数据集已整理完毕，点击下方链接即可下载：

下载地址：

链接: https://pan.baidu.com/s/1p6Gx0ilMBTbf8yYoTBujcg?pwd=m8jf
提取码: m8jf

下载后解压即可得到完整的database/猪的危险行为数据集目录结构，可直接用于YOLO系列模型的训练。

7.2 使用建议

模型选择：若追求极致精度，建议使用YOLOv8l或YOLOv8x；若需实时部署在边缘设备（如海思、瑞芯微开发板），YOLOv8n或YOLOv8s是更优选择。
迁移学习：建议在COCO预训练的权重基础上进行微调，可以加速收敛并提升最终精度。只需修改数据集的类别数量为3，并调整输出层即可。
后处理优化：对于实际应用场景，强烈建议结合时序信息进行行为状态平滑。例如，连续5帧检测到同一危险行为才触发告警，可以有效降低误报率。
部署建议：若部署在养殖场现场设备，建议采用夜间红外+白天可见光双模式模型切换策略，分别训练两个模型，根据光照条件自动切换，可以获得更优的整体性能。

7.3 常见问题解答

Q1：数据集是否包含夜间红外图像？

A：是的，数据集约30%的图像为夜间红外补光场景，确保模型在24小时监控场景下都能正常工作。

Q2：如何区分“攻击行为”和“玩耍行为”？

A：攻击行为通常伴随激烈姿态、用力冲撞/撕咬、被攻击者应激反应（尖叫、逃跑）；玩耍行为则姿态放松、力度温和。本数据集的标注由养殖专家把关，确保类别判定的准确性。

Q3：模型对遮挡场景的鲁棒性如何？

A：通过Mosaic增强和遮挡模拟，模型已具备一定的抗遮挡能力。但在实际部署中，建议结合多角度摄像头布设，减少遮挡盲区。

Q4：数据集是否包含多品种猪只？

A：是的，数据集覆盖大白猪、长白猪、杜洛克猪及其杂交后代，确保模型具备品种泛化能力。

八、结语

生猪养殖中的危险行为是导致猪只受伤、死亡和经济损失的重要原因。通过AI视觉技术实现危险行为的自动识别与预警，是智慧养殖的重要发展方向。本数据集聚焦攻击、咬耳朵、咬尾巴三类典型危险行为，包含5000余条高质量标注样本，标注准确率达98%以上，覆盖多品种、多场景、多光照条件，可直接用于YOLO系列模型的训练。

我希望能通过开源这套数据集，为智慧养殖领域的研究者和开发者提供一份有力的支持，降低行业研发门槛，推动AI技术在畜牧业的落地应用。如果你在使用过程中有任何问题、建议，或者希望参与到数据集的后续扩充中来，欢迎在评论区留言交流。