YOLO推理入门学习笔记（第二集）

2501_94220570

327人浏览 · 2026-05-02 15:19:00

2501_94220570 · 2026-05-02 15:19:00 发布

⏱ 0:07 - 1:36｜AI核心概念：推理 vs 训练

🎯 核心结论

推理（Inference） = 用模型做预测
训练（Training） = 让模型变得更准（优化参数）

🧠 推理是什么？

输入一张图片 → 模型输出结果（有什么目标）
本质：
👉 推理 = 预测

🧠 参数的作用

模型内部有很多“参数”
参数变化 → 预测结果变化
初始参数：
👉 一般很差（几乎预测不到）

🧠 训练是什么？

输入：
- 图片 + 正确答案（标注）
过程：
- 每训练一次 → 参数更新一次
结果：
👉 训练越多 → 模型越准

📌 总结

推理 = 使用模型
训练 = 获得模型

⏱ 1:43 - 2:50｜学习路径说明

🎯 本节目标

先学：如何使用别人训练好的模型（推理）
再学：如何训练自己的模型

👉 顺序非常关键！

⏱ 2:54 - 4:02｜第一个YOLO推理脚本

🧾 代码结构

from ultralytics import YOLO

model = YOLO(r"yolo11n.pt")

model.predict(
    source=r"ultralytics/assets",
    save=True,
    show=False,
)

🧠 预测的三大核心组成

1️⃣ 模型

YOLO("yolo11n.pt")

👉 用哪个模型预测

2️⃣ 预测目标

source=...

👉 预测什么（图片/视频/文件夹/摄像头）

3️⃣ 预测选项

save=True
show=False

参数	作用
save	是否保存结果
show	是否实时显示

📌 至少开一个，不然白跑！

⏱ 4:05 - 6:07｜预测结果解析

🖥 输出信息解读

每一行代表一张图片：

图片名
分辨率（预处理后）
检测结果（类别+数量）
推理时间（ms）

👉 整个脚本本质：

用某个模型，对某个目标，按你的要求做预测

⏱ 7:46 - 10:17｜预测目标（source）详解

📂 支持类型

✅ 文件夹

🖼 单张图片

🎥 视频

👉 视频本质是：一帧一帧当图片处理

⏱ 10:33 - 11:22｜实时显示（show）

🎯 想实时看结果？

show=True
save=False

⚠️ 注意

分辨率太高 → 显示可能不完整（正常）

⏱ 11:09 - 12:02｜摄像头推理

source=0

👉 直接调用摄像头

⚠️ 重要问题：内存爆炸

原因：

每一帧结果都存在内存中
越跑越多 → 内存占满

👉 解决方案：

使用专门脚本（如 MyCam.py）
或使用 stream=True（进阶）

from ultralytics import YOLO

import cv2

model = YOLO(r"yolo11n.pt")
results = model(
    source=0,
    stream=True,
)

for result in results:
    plotted = result.plot()
    cv2.imshow(winname="yolo inference", mat=plotted)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

⏱ 12:42 - 14:12｜官方支持的输入类型

常见：

图片
视频
文件夹
摄像头

⏱ 14:23 - 20:40｜模型理解（重点‼️）

🧠 三个维度理解模型

1️⃣ 做什么任务？

YOLO支持5种：

目标检测（detect）
分割（segment）
分类（classify）
姿态（pose）
旋转检测（obb）

📌 查看方式：

print(model.task)

2️⃣ 能识别什么类别？

📌 查看方式：

print(model.names)

🧠 关键结论

👉 模型只能识别它训练过的类别！

比如：

YOLO11n：80类（COCO数据集）
不包含 → 就识别不了

3️⃣ 模型大小（参数量）

📌 查看参数数量：

print(sum(p.numel() for p in model.parameters()))

📊 模型大小对比

后缀	含义
n	nano（最小）
s	small
m	medium
l	large
x	extra large

🧠 重要规律

👉 参数越多：

✔ 精度更高
❌ 速度更慢
❌ 更吃显存

⏱ 20:56 - 23:10｜模型选择建议

🎯 推荐入门

YOLOv8
YOLOv11

👉 结构清晰 + 支持完整

⚠️ 注意

👉 版本高 ≠ 一定更好

⏱ 26:27 - 26:57｜预测选项总结

👉 你需要掌握：

什么是预测选项
去哪里查（官方文档）https://docs.ultralytics.com/zh/modes/predict/#inference-sources
怎么加（写一行参数）

🔥 最终总结:YOLO推理三要素

👉 缺一不可

模型（model）
目标（source）
选项（args）

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

使用langchain调用聊天模型报错

【代码】使用langchain调用聊天模型报错。

AtomGit开源社区

2026山东大学软件学院创新实训——IntelliHealth(五)：药物管理、智能分析与药物禁忌分析模块协同完善

本周团队工作重点从单纯功能开发逐渐转向系统架构优化与模块协同完善。家庭药箱管理模块完成重构并实现完整扫码入库流程；用户画像与健康分析模块完成后端落地；药物禁忌分析模块在性能与准确率方面进一步提升。截至目前，IntelliHealth 已经初步形成了“健康档案—健康分析—药物管理—禁忌分析”的核心业务闭环，为后续智能提醒、知识图谱扩展以及更多AI健康服务功能奠定了基础。