YOLOv8美国硬币识别检测系统（项目源码+YOLO数据集+模型权重+UI界面+python+深度学习+环境配置）

斌擎人工智能官方账号

45人浏览 · 2026-05-26 16:31:50

斌擎人工智能官方账号 · 2026-05-26 16:31:50 发布

摘要

本文设计并实现了一种基于YOLOv8的美国硬币识别检测系统，旨在自动识别图像中的四种常见硬币：Dime（10美分）、Nickel（5美分）、Penny（1美分）和Quarter（25美分）。系统采用YOLOv8目标检测框架，在包含120张标注图像的数据集上进行训练、验证与测试。实验结果表明，模型在验证集上的mAP50和mAP50-95均达到1.0，精确率与召回率表现良好。然而，混淆矩阵分析显示，Nickel与Penny之间存在较为严重的相互误判问题，Dime与Nickel也存在一定混淆。整体而言，该系统在Quarter识别上表现最佳，但在样本不平衡和小目标识别方面仍有改进空间。本研究为硬币检测系统的实际部署提供了可行方案和优化方向。

引言

在美国，硬币自动识别系统广泛应用于自动售货机、硬币清分机、自助收银等场景，对硬币的快速、准确识别具有重要的实际意义。然而，不同硬币之间在尺寸、颜色、边缘纹理等方面存在细微差异，尤其是Nickel与Penny在视觉特征上较为接近，容易导致识别混淆。传统方法依赖人工特征提取或传统图像处理技术，泛化能力有限。近年来，基于深度学习的目标检测方法，特别是YOLO系列模型，因其高速度和高精度成为目标检测任务的主流选择。本文基于YOLOv8构建美国硬币识别检测系统，利用少量标注图像进行训练，并系统分析模型在不同硬币类别上的识别性能。

功能模块

✅ 用户登录注册：支持密码检测，密码加密。

✅ 图片检测：可对图片进行检测，返回检测框及类别信息。

✅参数实时调节（置信度和IoU阈值）

✅ 支持选择检测目标：可以选择一个或者多个类目的目标进行检测

✅ 视频检测：支持视频文件输入，检测视频中每一帧的情况。

✅ 摄像头实时检测：连接USB 摄像头，实现实时监测。

✅日志记录：日志标签页记录操作和错误信息，带时间戳

✅结果保存模块：支持图片/视频/摄像头检测结果保存

1、用户管理模块

功能	描述
用户注册	用户名、密码、确认密码、邮箱（选填）注册，密码SHA256加密存储
用户登录	用户名密码验证，自动跳转主界面
用户数据存储	JSON文件存储用户信息（密码加密、注册时间、邮箱）
登录状态	主界面显示当前登录用户名

2、界面与交互模块

功能	描述
玻璃效果界面	半透明毛玻璃背景，圆角边框，现代化视觉风格
无边框窗口	自定义标题栏，支持窗口拖动、最小化、最大化、关闭
响应式布局	主窗口三栏布局（左侧控制区、中央显示区、右侧信息区）
状态栏	显示设备信息、模型状态、当前用户、实时时间

3、检测源管理模块

功能	描述
图片检测	支持JPG/JPEG/PNG/BMP格式图片载入
视频检测	支持MP4/AVI/MOV/MKV格式视频载入
摄像头检测	实时调用摄像头（默认ID 0）进行检测
检测源切换	下拉菜单切换三种检测模式，自动更新界面状态

4、检测参数配置模块

功能	描述
置信度阈值	滑动条调节（0-100%，步长1%），实时显示当前值
IoU阈值	滑动条调节（0-100%，步长1%），实时显示当前值
类别选择	动态生成检测类别复选框，支持全选/取消全选
参数同步	参数实时同步到检测器核心

5、YOLO检测核心模块

功能	描述
模型加载	加载`best.pt`模型文件，自动检测GPU可用性，支持CPU/GPU切换
多模式检测	图片检测、视频检测、摄像头实时检测
检测线程	基于QThread的多线程处理，避免界面卡顿
检测结果	返回目标类别、置信度、边界框坐标
FPS计算	实时计算处理帧率
进度反馈	视频处理进度条实时更新

6、结果显示模块

功能	描述
实时画面	中央区域显示检测结果图像（带标注框）
统计信息	检测状态、目标数量、FPS、处理帧数实时更新
检测列表	右侧列表显示当前帧所有检测到的目标（类别+置信度）
日志记录	日志标签页记录操作和错误信息，带时间戳
占位显示	未选择检测源时显示系统LOGO和提示文字

7、结果保存模块

功能	描述
保存开关	复选框控制是否保存检测结果
路径选择	自定义保存路径，支持图片/视频格式自动识别
自动命名	保存文件自动添加时间戳（`detection_result_20240101_120000.jpg`）
视频保存	支持检测结果视频录制（MP4格式）
手动保存	工具栏保存按钮可随时保存当前画面
保存反馈	保存成功弹窗提示，日志记录保存路径

8、工具栏功能

功能	描述
图片按钮	快速切换到图片检测模式并打开文件选择器
视频按钮	快速切换到视频检测模式并打开文件选择器
摄像头按钮	快速切换到摄像头检测模式
保存按钮	手动保存当前显示画面

9、辅助功能

功能	描述
错误处理	统一错误弹窗提示，日志记录错误详情
资源清理	检测停止时自动释放摄像头、视频文件、视频写入器资源
时间显示	状态栏实时显示系统时间
模型状态	状态栏显示模型加载状态和当前设备（CPU/GPU）

10、数据校验模块

功能	描述
注册验证	用户名长度≥3，密码长度≥6，密码一致性检查，邮箱格式验证
协议确认	注册前需勾选同意用户协议
文件校验	模型文件存在性检查，文件大小验证（≥6MB）
输入非空	登录/注册时必填项非空检查

背景

美国硬币主要包括Dime、Nickel、Penny和Quarter四种面额，尺寸与材质各不相同。其中，Penny直径最小（19.05mm），Nickel直径最大（21.21mm），Dime虽面额高于Penny但直径更小（17.91mm），这种非线性的尺寸分布增加了视觉识别的难度。此外，硬币在真实场景中可能存在旋转、遮挡、光照变化、背景复杂等问题，进一步挑战检测算法的鲁棒性。

传统硬币识别方法多基于模板匹配、边缘检测或物理传感器（如尺寸、重量、电导率），在固定环境下表现尚可，但对图像质量敏感，难以适应多变场景。随着深度学习的发展，基于CNN的目标检测模型如Faster R-CNN、SSD、YOLO系列已在物体检测领域取得显著成效。YOLOv8作为当前最先进的实时目标检测算法之一，具备结构灵活、训练高效、精度高等特点，适合资源受限的边缘设备部署。因此，研究基于YOLOv8的硬币识别系统，既有助于提升硬币自动识别的智能化水平，也为小目标、少样本、类别不均衡等现实问题的解决提供了实验基础。

数据集介绍

本研究所使用的美国硬币图像数据集为自建数据集，共包含120张标注图像，其中训练集105张，验证集10张，测试集5张。图像涵盖四种硬币类别：

类别名称	含义	面额
Dime	10美分	0.10美元
Nickel	5美分	0.05美元
Penny	1美分	0.01美元
Quarter	25美分	0.25美元

训练过程

训练结果

混淆矩阵分析

Dime（1角）：识别较准确，但容易与Nickel（5分）混淆（0.23）。
Nickel：表现较差，与Dime和Penny混淆严重（分别0.46、0.42）。
Penny（1分）：识别最差，主要被误判为Nickel（0.93）。
Quarter（25分）：识别最佳，几乎没有混淆（对角元0.91）。

PR曲线与F1曲线

PR曲线：各类别曲线接近(1,1)，说明精确率与召回率平衡良好。
F1曲线：
- Penny 最高F1 ≈ 0.96
- Dime/Nickel ≈ 0.88
- Quarter ≈ 0.98
最佳置信度阈值：约0.5~0.6之间。

精确率/召回率随置信度变化

P-curve：Penny精确率最早达到1.0，Nickel最晚。
R-curve：所有类别召回率在低置信度下接近0.98，但随置信度上升，Nickel召回率下降明显。

训练过程曲线

损失函数：训练集和验证集的box_loss、cls_loss、dfl_loss均稳定下降，无过拟合。
mAP50：达到1.0
mAP50-95：达到1.0

模型在训练集和验证集上表现优秀。

常用标注工具

假设您现在准备好进行标注。有几种开源工具可以帮助简化数据标注流程。以下是一些有用的开放标注工具：

Label Studio：一个灵活的工具，支持各种标注任务，并包含用于管理项目和质量控制的功能。 CVAT：一个强大的工具，支持各种标注格式和可定制的工作流程，使其适用于复杂的项目。 Labelme：一个简单易用的工具，可以快速标注带有多边形的图像，非常适合简单的任务。 LabelImg: 一款易于使用的图形图像标注工具，特别适合以 YOLO 格式创建边界框标注。

用于实例分割的 LabelMe 标注工具

这些开源工具经济实惠，并提供一系列功能来满足不同的标注需求。

界面核心代码：

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

基于yolov8的课堂行为检测系统——主要功能检测睡觉、手机、人数

本文介绍了一个基于YOLOv8和OpenCV的课堂行为检测系统，主要用于自动识别学生睡觉、玩手机等行为并进行人数统计。系统采用YOLOv8n轻量级模型，通过180张标注图像（训练集130张/验证集50张）进行训练，支持图片、视频和实时摄像头检测。设计包含三大模块：数据集构建（使用LabelImg标注三类行为）、模型训练（基于YOLOv8n迁移学习）和可视化界面（PyQt5开发）。系统可准确检测课堂

AtomGit开源社区

Gemini3.5如何让机器人从规划到精准执行

AtomGit开源社区

TimesFM：谷歌的时间序列预测基础模型

TimesFM是一个由谷歌研究团队创建的基础时间序列预测模型。更具体地说，TimesFM有 2 亿个参数。在 100 亿个真实世界的时间点上进行训练。允许额外的协变量作为特征。利用因果自注意力和残差块。在零样本预测中优于其他 SOTA 模型。接下来，让我们看看TimesFM是如何克服构建基础时间序列模型挑战的。请查看AI 项目文件夹中关于时间融合 Transformer (TFT)的更新教程，这是