YOLOv11 手机动态识别流程总结

  1. droidcam &启动后台服务作用:在 Linux 后台开启 DroidCam 客户端。

    • 目的:它负责与你手机上的 App 建立通信协议,并将接收到的手机摄像头画面准备转换成 Linux 系统可识别的视频流。

  2. ffplay /dev/video0链路验证(关键一步)

    • 作用:使用 FFmpeg 工具直接播放视频节点 /dev/video3 的画面。

    • 目的确认硬件通路已通。如果你能在这里看到手机画面,说明 DroidCam 已经成功创建了虚拟摄像头,且权限和连接都没有问题,为后续 YOLO 调用打下基础。

  3. conda activate pt环境切换

    • 作用:激活名为 pt 的 Conda 虚拟环境。

    • 目的:进入预先安装好 ultralyticsopencvtorch 等依赖库的特定环境,确保 yolo 命令可以被系统识别并正确执行。

  4. yolo task=detect mode=predict ...启动实时 AI 推理

    • yolo task=detect mode=predict model=yolo11n.pt source=0 device=cpu show=True

    • 核心参数解析:yolo task=detect mode=predict model=yolo11n.pt source=0 device=cpu show=True

      • model=yolo11n.pt:加载权重文件(需确保该文件在当前目录下)。

      • source=3:指定读取 /dev/video3 的视频流。

      • device=cpu:强制使用 CPU 进行计算,绕过显卡配置。

      • show=True:实时弹出带有检测框(Bounding Box)和类别标签的预览窗口。

5.使用GPU跑

yolo task=detect mode=predict model=yolo11n.pt source=0 device=0 show=True

YOLOv11 GPU 运行指南 (RTX 5060 专用版)

1. 核心开启步骤 (每次开机必做)

打开终端,进入你建立的“特区”环境。只有激活了环境,系统才会调用那个支持 50 系显卡的 Nightly 版 PyTorch。

Bash

conda activate yolo_gpu

2. 运行推理 (识别) 的标准命令

使用以下命令可以确保显卡全力输出:

Bash

yolo predict model=yolo11n.pt source='你的路径' device=0 half=True
  • device=0: 强制指定使用第一块显卡(GPU)。

  • half=True: 开启 FP16 半精度,这是 50 系显卡的“物理外挂”,速度翻倍且节省显存。

  • show=True: (可选) 如果你想实时看到识别画面,加上这个。


3. 三种常见的任务场景

场景 命令示例
跑图片 yolo predict model=yolo11n.pt source='bus.jpg' device=0
跑视频 yolo track model=yolo11n.pt source='test.mp4' device=0 half=True
跑摄像头 yolo predict model=yolo11n.pt source=0 device=0 show=True

4. 结果在哪里看?

所有的运行结果(带框的图片/视频)都会自动保存在:

主目录(Home) -> runs -> detect -> predict (数字最大的那个文件夹)


给你的额外小建议:

  • 权限持久化:如果重启电脑后发现 /dev/video3 打不开,记得再次执行 sudo chmod 777 /dev/video3

  • 流畅度优化:如果觉得 CPU 跑起来有延迟,可以在第四个命令后面加上 imgsz=320,这会牺牲一点精度但大幅提升帧率(FPS)。

  • 停止运行:在终端按下 Ctrl + C 即可停止检测程序。

为什么要用 Conda?(解决“版本地狱”)

想象一下,如果你在做两个项目:

  • 项目 A (YOLO11):需要 Python 3.10 和 PyTorch 2.4。

  • 项目 B (旧的 ROS 项目):可能需要 Python 3.8 和一个老版本的库。

如果你把它们都装在系统自带的 Python 里,它们就会因为版本冲突打架,导致系统直接崩溃。

Conda 的作用: 它能帮你创建很多个相互独立的“虚拟房间”(也就是 ptyolo_gpu 这些环境)。

  • pt 房间里,你可以随便折腾最新的显卡驱动和 PyTorch。

  • yolo_gpu 房间里,你可以保持一套最稳定的配置。

  • 它们之间物理隔离,互不干扰。


2. Conda 还是一个“超级安装助手”

平时我们用 pip 安装东西,但 pip 有时候搞不定显卡驱动(CUDA)这种复杂的非 Python 库。

  • Conda 厉害的地方在于,它不仅能装 Python 的包,还能顺带帮你把 CUDA ToolkitC++ 编译器 等底层工具一起打包安顿好。


3. 你最常用的几个“咒语”

既然你已经有环境了,这几个命令以后会经常用到:

命令 作用
conda env list 查看你一共开了多少个“房间”(你刚才执行过)。
conda create -n 名字 python=3.10 新建一个指定 Python 版本的房间。
conda activate 名字 最常用: 走进某个房间,开始干活。
conda deactivate 走出房间,回到主系统。
conda install 包名 在当前房间里安装新工具。
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐