如果你最近几年接触过工业视觉 AI,大概率会看到一种现象:

很多项目一开始都会说:

“我们要用 YOLO 做检测。”

于是流程往往是这样:

  1. 拍图
  2. 标注缺陷
  3. 训练 YOLO
  4. 部署到产线

看起来非常合理。

但现实情况往往是:

  • 模型精度不稳定
  • 误检很多
  • 现场环境变化就失效
  • 最终还是回到传统视觉算法

于是很多人开始怀疑:

YOLO 在工业视觉里是不是不好用?

其实并不是。

真正的问题往往是:

很多人一开始就用错了 YOLO。

在工业检测里,YOLO 很少是 唯一算法

更常见的做法其实是:

AI 粗检
传统视觉精检

也就是说:

YOLO 负责“找问题”,传统算法负责“判断问题”。

这篇文章就结合一些真实项目经验,聊一聊:
YOLO 在工业检测里到底该怎么用。

一、YOLO 最擅长做什么?

先说结论:

YOLO 最擅长的是:

目标定位(Object Detection)

也就是回答一个问题:

哪里可能有问题?

例如:

划痕
污点
缺料
毛刺
异物

YOLO 可以在整张图里找到这些区域。

例如:

整图:2592 × 1944

YOLO 输出:

缺陷1  (x1,y1,x2,y2)
缺陷2  (x1,y1,x2,y2)
缺陷3  (x1,y1,x2,y2)

这样就把 检测范围缩小了

所以在工业视觉里:

YOLO 更像是一个 区域搜索器(Region Finder)。

二、YOLO 不擅长做什么?

很多人会犯一个错误:

用 YOLO 直接做最终判断。

例如:

是否合格?

但工业检测往往有很多 精细规则
例如:

划痕长度 > 0.5 mm

或者:

孔径必须 2.00 ± 0.05 mm

这些任务 YOLO 并不擅长。

原因很简单:

YOLO 的输出是:

Bounding Box

而不是:

精确测量

所以如果你试图让 YOLO 直接判断:

尺寸是否合格

结果往往是:

误检很多

三、工业视觉里更常见的方案

在很多真实项目中,更稳定的架构其实是:

YOLO 负责粗检
Halcon / OpenCV 负责精检

流程一般是这样:

相机采图
    ↓
YOLO 检测缺陷区域
    ↓
截取 ROI
    ↓
Halcon 精细检测

例如:

YOLO:找到可能的污点
Halcon:判断污点面积

或者:

YOLO:找到连接器 Pin
Halcon:测量 Pin 间距

这样每种算法都发挥自己的优势。

四、一个真实的工业视觉架构

在 C# 工业视觉系统里,一个典型结构可能是:

Camera
   ↓
Image Preprocess
   ↓
YOLO (ONNX Runtime)
   ↓
ROI Extract
   ↓
Halcon Algorithm
   ↓
Result Output

简单理解就是:

AI 找区域
传统算法做判断

这种方式通常比:

纯 AI

更加稳定。

五、为什么工业视觉不完全依赖 AI?

很多刚接触工业视觉的人会问:

为什么不用 AI 直接判断?

原因其实有三个。
原因一:数据很难覆盖所有情况

  • 工业环境变化很多:
  • 光照变化
  • 材料差异
  • 相机角度变化

如果训练数据不够全面,AI 很容易失效。

而传统视觉算法往往更加稳定。

原因二:很多检测是规则问题

例如:

孔径大小
位置偏移
角度偏差

这些本质是:

几何测量

传统算法往往更准确。

原因三:客户更容易接受可解释算法

很多工厂更喜欢这样的逻辑:

检测到缺陷
缺陷面积 > 阈值
判定 NG

这种规则:
容易解释。
而 AI 结果有时候很难解释。

六、YOLO 在工业检测里的正确角色

如果用一句话总结:

YOLO 是工业视觉里的 “问题发现者”。

而不是:

“最终裁判”。

一个比较合理的分工是:

YOLO
负责发现可能问题
Halcon / OpenCV
负责精细检测

这样系统既有:

  • AI 的灵活性
  • 传统算法的稳定性

七、一个非常常见的工业视觉 AI 架构

在实际项目中,一个完整系统可能是这样的:

相机采图
    ↓
图像预处理
    ↓
YOLO 检测
    ↓
缺陷 ROI 提取
    ↓
Halcon 精检
    ↓
结果输出

如果再加上系统工程部分:

相机
采集线程
推理线程
算法线程
PLC通讯
日志系统
UI显示

整个系统其实是一个 完整的软件工程系统

而不仅仅是一个 AI 模型。

最后
很多人刚接触工业视觉 AI 时,会觉得:

“只要模型够好,一切问题都会解决。”

但当项目真正进入产线之后,才会发现:

工业视觉的难点往往不是:

模型

而是:

系统架构
稳定性
工程实现

AI 只是其中的一部分。
在很多真实项目中:

AI + 传统视觉算法
才是工业视觉最常见的组合。

我正在整理一套《工业视觉AI实战工具包》,包括源码、案例、学习路线。
如果你想第一时间获取资料包,请关注公众号–视觉小码农

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐