基于 YOLOv10 与 PyQt5 构建汽车零件缺陷检测系统：从开发到落地

纤纡.

583人浏览 · 2026-05-20 19:27:21

纤纡. · 2026-05-20 19:27:21 发布

在汽车制造行业，零件缺陷检测是保障产品质量的核心环节。传统人工检测方式存在效率低、漏检率高、主观性强等问题，而基于计算机视觉的自动化检测方案能够有效解决这些痛点。本文将详细介绍如何结合 YOLOv10 目标检测模型与 PyQt5 图形界面框架，开发一套功能完整、交互友好的汽车零件缺陷检测系统，并附带图片转滑动视频的辅助功能，满足检测结果可视化需求。

1.1 核心技术选型

目标检测模型：YOLOv10YOLOv10 是 2024 年推出的新一代轻量级目标检测模型，相比前代 YOLO 系列，在保持高精度的同时大幅提升了推理速度，且支持灵活的模型轻量化部署（如 yolov10n），非常适合工业场景下的实时检测需求。
界面开发框架：PyQt5PyQt5 提供了丰富的 GUI 组件和完善的多线程机制，能够轻松构建跨平台的桌面应用，且支持与 OpenCV 无缝集成，满足图像 / 视频处理的可视化需求。
图像处理库：OpenCV负责图像读取、视频编解码、帧处理等底层操作，是计算机视觉应用的基础工具。
辅助功能：图片转滑动视频针对批量检测的零件图片，实现横向拼接滑动视频生成，便于检测结果的回放与分析。

二、系统整体架构设计

本系统分为三大核心模块：UI 交互层、检测业务层、辅助工具层，整体架构如下：

├── UI交互层（UiMain.py）：负责界面布局、组件交互、结果可视化
├── 检测业务层（汽车零件缺陷检测系统.py）：核心检测逻辑、多线程处理、结果保存
└── 辅助工具层（图片生成视频.py）：批量图片转滑动视频，支持检测结果可视化回放

2.1 核心模块职责

UI 交互层：通过 PyQt5 Designer 设计界面布局，封装图像显示、结果表格更新、状态栏提示等通用 UI 操作，保证界面交互的一致性。
检测业务层：实现 YOLOv10 模型加载、多线程检测（避免界面卡顿）、检测结果解析与保存，支持图片、视频、摄像头三种检测源。
辅助工具层：将批量零件检测图片转换为横向滑动视频，支持自定义视频分辨率、滑动速度、帧率等参数，便于检测结果的动态展示。

三、核心功能模块实现

3.1 UI 界面开发（UiMain.py）

UI 界面是用户与系统交互的核心，本系统的界面布局遵循 “功能分区、操作直观” 的原则，主要分为 5 个区域：

3.1.1 界面布局设计

配置栏：包含模型选择、置信度阈值调节、IoU 阈值调节，支持用户自定义检测参数；
功能按钮区：图片检测、视频检测、摄像头检测、停止检测、保存结果，一键式操作；
图像显示区：分栏显示原始图像 / 视频帧与检测结果帧，直观对比；
结果表格区：展示检测到的缺陷类别、置信度、目标中心坐标，便于精准分析；
状态栏：实时反馈系统运行状态（如模型加载、检测进度、保存路径等）。

3.1.2 关键 UI 操作封装

为保证业务层与 UI 层解耦，封装了通用的 UI 操作方法：

def display_image(self, label, image):
    """将numpy数组格式的图像显示到QLabel组件，保持宽高比"""
    h, w, ch = image.shape
    bytes_per_line = ch * w
    qt_image = QtGui.QImage(image.data, w, h, bytes_per_line, QtGui.QImage.Format_RGB888)
    pixmap = QtGui.QPixmap.fromImage(qt_image).scaled(
        label.size(), QtCore.Qt.KeepAspectRatio, QtCore.Qt.SmoothTransformation
    )
    label.setPixmap(pixmap)

def add_detection_result(self, class_name, confidence, x, y):
    """向结果表格添加检测数据，格式化显示"""
    row = self.table_widget.rowCount()
    self.table_widget.insertRow(row)
    self.table_widget.setItem(row, 0, QtWidgets.QTableWidgetItem(class_name))
    self.table_widget.setItem(row, 1, QtWidgets.QTableWidgetItem(f"{confidence:.2f}"))
    self.table_widget.setItem(row, 2, QtWidgets.QTableWidgetItem(f"{x:.2f}"))
    self.table_widget.setItem(row, 3, QtWidgets.QTableWidgetItem(f"{y:.2f}"))

3.2 检测业务层实现（汽车零件缺陷检测系统.py）

检测业务层是系统的核心，重点解决 “模型加载、异步检测、结果解析、资源释放” 四大问题。

3.2.1 多线程检测设计

由于目标检测是耗时操作，若直接在主线程执行会导致界面卡顿，因此设计DetectionThread线程类：

class DetectionThread(QThread):
    # 定义信号：传递原始帧、检测后帧、检测结果
    frame_received = pyqtSignal(np.ndarray, np.ndarray, list)
    finished_signal = pyqtSignal()

    def __init__(self, model, source, conf, iou, parent=None):
        super().__init__(parent)
        self.model = model  # 加载好的YOLO模型
        self.source = source  # 检测源（图片/视频/摄像头）
        self.conf = conf  # 置信度阈值
        self.iou = iou  # IoU阈值
        self.running = True  # 线程运行标记

    def run(self):
        """线程执行入口，区分不同检测源处理逻辑"""
        try:
            # 处理摄像头/视频源
            if isinstance(self.source, int) or self.source.endswith(('.mp4', '.avi', '.mov')):
                cap = cv2.VideoCapture(self.source)
                while self.running and cap.isOpened():
                    ret, frame = cap.read()
                    if not ret: break
                    original_frame = frame.copy()
                    # YOLO检测核心调用
                    results = self.model(frame, conf=self.conf, iou=self.iou)
                    annotated_frame = results[0].plot()
                    # 解析检测结果
                    detections = self._parse_results(results)
                    # 发送信号更新UI
                    self.frame_received.emit(
                        cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB),
                        cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB),
                        detections
                    )
                    time.sleep(0.03)  # 控制帧率
                cap.release()
            # 处理图片文件
            else:
                # 图片检测逻辑（略）
        except Exception as e:
            QMessageBox.critical(None, "检测错误", f"检测过程中出现错误：{str(e)}")
        finally:
            self.finished_signal.emit()

    def _parse_results(self, results):
        """解析YOLO检测结果，提取关键信息"""
        detections = []
        for result in results:
            for box in result.boxes:
                class_id = int(box.cls)
                class_name = self.model.names[class_id]
                confidence = float(box.conf)
                x, y, w, h = box.xywh[0].tolist()
                detections.append((class_name, confidence, x, y))
        return detections

    def stop(self):
        """停止线程运行"""
        self.running = False

3.2.2 主窗口业务逻辑整合

MainWindow类负责整合 UI 与检测线程，实现核心业务流程：

模型加载：支持本地自定义 YOLO 模型（.pt 文件）与默认模型加载；
检测触发：分别实现图片、视频、摄像头检测的触发逻辑；
结果处理：接收线程信号，更新 UI 显示与结果保存；
资源释放：窗口关闭时停止线程、释放视频写入器等资源。

关键代码示例（图片检测）：

def detect_image(self):
    if self.model is None:
        QMessageBox.warning(self, "警告", "请先选择并加载模型！")
        return
    # 选择图片文件
    file_path, _ = QFileDialog.getOpenFileName(
        self, "选择图片", "", "图片文件 (*.jpg *.jpeg *.png *.bmp)"
    )
    if file_path:
        self.ui.clear_results()
        # 读取原始图片并显示
        self.current_image = cv2.imread(file_path)
        self.current_image = cv2.cvtColor(self.current_image, cv2.COLOR_BGR2RGB)
        self.ui.display_image(self.ui.original_image_label, self.current_image)
        # 获取检测参数
        conf = self.ui.confidence_spinbox.value()
        iou = self.ui.iou_spinbox.value()
        # 启动检测线程
        self.detection_thread = DetectionThread(self.model, file_path, conf, iou)
        self.detection_thread.frame_received.connect(self.on_frame_received)
        self.detection_thread.finished_signal.connect(self.on_detection_finished)
        self.detection_thread.start()

3.2.3 检测结果保存

支持图片检测结果、视频 / 摄像头检测截图的保存，自动生成带时间戳的文件名，避免重复：

def save_result(self):
    if self.last_detection_result is None:
        QMessageBox.warning(self, "警告", "没有可保存的检测结果")
        return
    # 创建保存目录
    save_dir = "results"
    os.makedirs(save_dir, exist_ok=True)
    timestamp = time.strftime("%Y%m%d_%H%M%S")
    # 区分保存类型
    if self.is_camera_running or self.is_video_running:
        save_path = os.path.join(save_dir, f"snapshot_{timestamp}.jpg")
    else:
        save_path = os.path.join(save_dir, f"result_{timestamp}.jpg")
    # 保存图片
    cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR))
    self.ui.update_status(f"检测结果已保存: {save_path}")

3.3 辅助工具：图片转滑动视频（图片生成视频.py）

针对批量汽车零件检测图片，实现横向拼接滑动视频生成，便于检测结果的动态回放。核心流程如下：

3.3.1 图片预处理

读取指定文件夹内的所有图片（支持 jpg/bmp/png 格式）；
统一图片高度，宽度按比例缩放，保证拼接后视频的视觉一致性；
横向拼接所有图片，生成全景图。

def resize_images_to_same_height(images, target_height):
    """将所有图片调整为相同高度，宽度按比例缩放"""
    resized_images = []
    for img in images:
        height, width = img.shape[:2]
        scale = target_height / height
        new_width = int(width * scale)
        resized_img = cv2.resize(img, (new_width, target_height), interpolation=cv2.INTER_AREA)
        resized_images.append(resized_img)
    return resized_images

3.3.2 滑动视频生成

核心逻辑是逐帧截取全景图的指定区域，模拟滑动效果：

def create_sliding_video(image_folder, output_video="output_slide.mp4",
                         target_height=720, slide_speed=5, fps=30):
    # 1. 读取并预处理图片（略）
    # 2. 横向拼接生成全景图
    resized_images = resize_images_to_same_height(images, target_height)
    panorama = np.hstack(resized_images)
    # 3. 视频参数设置
    video_width = 1920
    max_x = panorama.shape[1] - video_width
    current_x = 0
    # 4. 创建视频写入器
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    video_writer = cv2.VideoWriter(output_video, fourcc, fps, (video_width, target_height))
    # 5. 逐帧生成滑动效果
    while current_x <= max_x:
        current_x = min(current_x, max_x)
        frame = panorama[:, current_x:current_x + video_width].copy()
        # 帧尺寸校验与修复
        if frame.shape[1] != video_width:
            frame = np.zeros((target_height, video_width, 3), dtype=np.uint8)
            display_width = min(panorama.shape[1] - current_x, video_width)
            frame[:, :display_width] = panorama[:, current_x:current_x + display_width]
        video_writer.write(frame)
        current_x += slide_speed
    # 6. 释放资源
    video_writer.release()

四、系统优化与异常处理

4.1 兼容性优化

视频编码兼容：针对不同平台的 OpenCV 编码支持差异，提供 mp4v（默认）和 avc1（H264）两种编码方案；
路径处理：统一使用绝对路径，解决中文路径、权限不足等问题；
数据类型校验：强制将图像数据转换为 uint8 格式，避免 OpenCV 写入视频时的类型错误。

4.2 异常处理机制

模型加载异常：捕获模型文件不存在、格式错误等异常，给出明确提示；
检测线程异常：在线程内捕获所有异常，避免程序崩溃，并通过弹窗反馈；
视频写入异常：校验视频写入器是否成功打开，若失败则提示路径权限、编码支持等问题；
资源释放：窗口关闭时强制停止检测线程，释放视频 / 摄像头资源，避免内存泄漏。

4.3 性能优化

多线程隔离：检测任务与 UI 更新完全隔离，保证界面流畅；
帧率控制：摄像头 / 视频检测时限制帧率（约 30fps），避免过度占用 CPU；
图片预处理优化：使用cv2.INTER_AREA插值法缩放图片，兼顾速度与质量。

五、系统部署与使用说明

5.1 环境依赖安装

# 基础依赖
pip install opencv-python pyqt5 numpy ultralytics
# 可选：安装YOLOv10依赖
pip install git+https://github.com/THU-MIG/yolov10.git

5.2 快速使用步骤

模型准备：准备训练好的汽车零件缺陷检测 YOLOv10 模型（.pt 文件），或使用默认的 yolov10n 模型；
启动系统：运行汽车零件缺陷检测系统.py，打开 GUI 界面；
模型加载：点击 “选择模型文件”，加载本地.pt 模型；
参数设置：调节置信度（默认 0.8）、IoU 阈值（默认 0.5）；
检测操作：
- 图片检测：点击 “图片检测”，选择待检测的零件图片；
- 视频检测：点击 “视频检测”，选择待检测的视频文件；
- 摄像头检测：点击 “摄像头检测”，实时检测摄像头画面；
结果保存：检测完成后，点击 “保存结果”，结果自动保存到results文件夹；
可视化回放：将批量检测图片放入指定文件夹，运行图片生成视频.py，生成滑动视频。