⏱ 0:07 - 1:36|AI核心概念:推理 vs 训练

🎯 核心结论

  • 推理(Inference) = 用模型做预测
  • 训练(Training) = 让模型变得更准(优化参数)

🧠 推理是什么?

  • 输入一张图片 → 模型输出结果(有什么目标)
  • 本质:
    👉 推理 = 预测

🧠 参数的作用

  • 模型内部有很多“参数”
  • 参数变化 → 预测结果变化
  • 初始参数:
    👉 一般很差(几乎预测不到)

🧠 训练是什么?

  • 输入:
    • 图片 + 正确答案(标注)
  • 过程:
    • 每训练一次 → 参数更新一次
  • 结果:
    👉 训练越多 → 模型越准

📌 总结

  • 推理 = 使用模型
  • 训练 = 获得模型

⏱ 1:43 - 2:50|学习路径说明

🎯 本节目标

  • 先学:如何使用别人训练好的模型(推理)
  • 再学:如何训练自己的模型

👉 顺序非常关键!


⏱ 2:54 - 4:02|第一个YOLO推理脚本

🧾 代码结构

from ultralytics import YOLO

model = YOLO(r"yolo11n.pt")

model.predict(
    source=r"ultralytics/assets",
    save=True,
    show=False,
)

🧠 预测的三大核心组成

1️⃣ 模型
YOLO("yolo11n.pt")

👉 用哪个模型预测


2️⃣ 预测目标
source=...

👉 预测什么(图片/视频/文件夹/摄像头)


3️⃣ 预测选项
save=True
show=False
参数 作用
save 是否保存结果
show 是否实时显示

📌 至少开一个,不然白跑!


⏱ 4:05 - 6:07|预测结果解析

🖥 输出信息解读

每一行代表一张图片:

  • 图片名
  • 分辨率(预处理后)
  • 检测结果(类别+数量)
  • 推理时间(ms)

👉 整个脚本本质:

用某个模型,对某个目标,按你的要求做预测


⏱ 7:46 - 10:17|预测目标(source)详解

📂 支持类型

✅ 文件夹
🖼 单张图片
🎥 视频

👉 视频本质是:一帧一帧当图片处理


⏱ 10:33 - 11:22|实时显示(show)

🎯 想实时看结果?

show=True
save=False

⚠️ 注意

  • 分辨率太高 → 显示可能不完整(正常)

⏱ 11:09 - 12:02|摄像头推理

source=0

👉 直接调用摄像头


⚠️ 重要问题:内存爆炸

原因:

  • 每一帧结果都存在内存中
  • 越跑越多 → 内存占满

👉 解决方案:

  • 使用专门脚本(如 MyCam.py)
  • 或使用 stream=True(进阶)
  • from ultralytics import YOLO
    
    import cv2
    
    model = YOLO(r"yolo11n.pt")
    results = model(
        source=0,
        stream=True,
    )
    
    for result in results:
        plotted = result.plot()
        cv2.imshow(winname="yolo inference", mat=plotted)
        if cv2.waitKey(1) & 0xFF == ord("q"):
            break

⏱ 12:42 - 14:12|官方支持的输入类型

常见:

  • 图片
  • 视频
  • 文件夹
  • 摄像头

⏱ 14:23 - 20:40|模型理解(重点‼️)

🧠 三个维度理解模型


1️⃣ 做什么任务?

YOLO支持5种:

  • 目标检测(detect)
  • 分割(segment)
  • 分类(classify)
  • 姿态(pose)
  • 旋转检测(obb)

📌 查看方式:

print(model.task)

2️⃣ 能识别什么类别?

📌 查看方式:

print(model.names)

🧠 关键结论

👉 模型只能识别它训练过的类别!

比如:

  • YOLO11n:80类(COCO数据集)
  • 不包含 → 就识别不了

3️⃣ 模型大小(参数量)

📌 查看参数数量:

print(sum(p.numel() for p in model.parameters()))

📊 模型大小对比

后缀 含义
n nano(最小)
s small
m medium
l large
x extra large

🧠 重要规律

👉 参数越多:

  • ✔ 精度更高
  • ❌ 速度更慢
  • ❌ 更吃显存

⏱ 20:56 - 23:10|模型选择建议

🎯 推荐入门

  • YOLOv8
  • YOLOv11

👉 结构清晰 + 支持完整


⚠️ 注意

👉 版本高 ≠ 一定更好


⏱ 26:27 - 26:57|预测选项总结

👉 你需要掌握:


🔥 最终总结:YOLO推理三要素

👉 缺一不可

  1. 模型(model)
  2. 目标(source)
  3. 选项(args)
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐