【YOLO2】
1. YOLOv5的核心架构由哪几个主要部分组成?
- Input:把数据处理好,喂给模型。
- Backbone:提取图片的基础特征。
- Neck:把不同特征融合起来,让模型看得更全面。
- Head:输出目标的位置、类别和置信度。
2. YOLOv5是如何进行目标检测的,它的检测流程是怎样的?
图片输入 → 预处理增强 → 骨干网络提取特征 → Neck 融合多尺度特征 → 检测头输出位置 / 置信度 / 类别 → NMS 去重 → 输出最终检测结果。
3. 在YOLOv5中,如何准备自己的数据集进行训练?
- 收集图片:准备业务场景图片,命名无中文、无特殊符号。
- 标注数据:用 LabelImg 标框,保存为 YOLO 格式(图片 + 同名 txt 标注)。
- 划分数据集:按 7:2:1 分成 train、val、test,分别放入 images、labels 对应文件夹。
- 写 yaml 配置文件:填数据集路径、类别总数 nc、类别名称 names。
- 开始训练:运行训练命令,指定数据 yaml、模型配置、预训练权重、迭代轮数即可。
4. 怎样调整YOLOv5的超参数来优化检测效果?
调学习率稳训练,调批次提精度,调置信度减错检,调轮数提效果,调数据增强防过拟合。
5. YOLOv5中的损失函数是如何计算的,有什么作用?
YOLOv5 用 CIoU 做框损失 + 交叉熵做置信和分类损失,分别约束框位置、有无目标、类别判断,训练时不断减小总损失,让模型越来越准。
6. 如何评估YOLOv5模型的性能,有哪些常用的评估指标?
一、常用评估指标
1. 精确率 Precision(查准率)
含义:模型预测出来的目标里,真正对的占比。作用:看模型乱不乱报错检。
2. 召回率 Recall(查全率)
含义:真实所有目标里,被模型找出来的占比。作用:看模型漏不漏检。
3. F1-score
含义:精确率和召回率的平衡综合值。作用:同时兼顾不准、不漏,越高整体效果越好。
4. mAP@0.5
含义:所有类别 AP 的平均值,IoU 阈值设为 0.5。作用:目标检测最核心指标,整体模型好坏看这个。
5. mAP@0.5:0.95
含义:从 IoU 0.5 到 0.95 多阈值平均。作用:更严格,看模型框定位精不精准。
6. FPS
含义:每秒能检测多少帧图片。作用:评估模型推理速度、实时性。
7. 混淆矩阵
作用:直观看出哪两类容易互相认错(比如 left 和 right 混分)。
二、怎么综合评估模型
- 看 mAP:整体性能高低
- 看 Precision:错检多不多
- 看 Recall:漏检多不多
- 看 F1:综合均衡效果
- 看 混淆矩阵:找类别混淆问题
- 看 FPS:能不能实时使用
7. 怎样在YOLOv5中处理小目标检测的问题?
放大输入尺寸 + 扩充小目标数据 + 加强数据增强 + 调低置信阈值 + 利用浅层多尺度特征
8. YOLOv5中的多尺度训练是如何实现的,有什么好处?
YOLOv5 多尺度训练就是训练时随机变换图片分辨率,让模型学会适应不同大小目标,提升泛化能力、大小目标都检测更准。
9. 如何将训练好的YOLOv5模型部署到实际应用场景中?
训练好 best.pt → 导出 ONNX / 轻量化格式 → 在电脑 / 嵌入式 / 网页 / 移动端调用,完成图片、视频、摄像头的实时目标检测部署。
10. YOLOv5相比之前的YOLO版本有哪些改进之处?
YOLOv5 在网络结构、损失函数、数据增强、自适应策略、模型轻量化、工程易用性、速度精度平衡上全面升级,比老版本更轻、更快、更准、更好部署。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)