最近我做了一个小工具:用 Qt/C++ 接入 PaddleOCR 本地模型,实现完全 零联网 OCR
你的图片不出本机,识别全程本地完成,隐私安全,工业和内网环境都适用。

只需下载完整目录,打开 LocalOcrDemo.exe,一分钟就能上手。


一、这个 Demo 能做什么

这个 Demo 支持的功能非常直观:

  • 全图识别:一键完成整张图片文字识别
  • 局部识别:拖拽矩形框选,支持旋转校正
  • 图片旋转:左/右旋转 90°
  • 实时结果显示:识别结果直接显示在右侧文本区
  • 中文界面:操作面板工业风,直观易用

使用流程

  1. 点击“加载图片”,图片显示在中间区域
  2. 如果图片方向不对,可左转/右转
  3. 选择“全图识别”或“局部识别”
  4. 局部识别时拖拽框,必要时调整旋转角度
  5. 点击“开始识别”,结果马上显示

适用场景:票据、物流标签、铭牌、表格截图、质检图片等


二、为什么选择本地 OCR

云 OCR API 优点明显:接入快、准确率高、维护简单。但在这些场景,本地 OCR 更适合:

  • 图片涉及隐私,不希望上传到云
  • 工业现场网络不稳定或内网环境无法访问互联网
  • 批量处理大量图片,避免 API 调用成本
  • 希望将 OCR 集成到桌面软件,离线也能用

本地 OCR 方案选择了:
Qt/C++ + Paddle Inference + PaddleOCR 本地模型

只要带齐运行目录,用户即可直接使用,离线也能完成识别。


三、技术方案 & 依赖

技术栈 作用
Qt Widgets + C++ 桌面界面开发
PaddleOCR + Paddle Inference 本地文字检测与识别
OpenCV 图片读取、旋转、裁剪
PP-OCRv3 中文模型 检测、识别、文字方向分类

调用流程
加载图片 → QImage → OpenCV Mat → PaddleOCR → 显示识别结果


四、工程目录 & 模型文件

项目目录结构示意

PaddleOcrLocalDemo/
|-- LocalOcrDemo.exe
|-- src/                  # Qt/C++ 源码
|-- resources/models/     # 本地模型文件
|-- deps/                 # Paddle Inference 和 OpenCV
|-- dist/                 # 发布目录
|-- scripts/              # 打包脚本

模型文件结构

resources/models/
|-- ch_PP-OCRv3_det_infer/       # 文字检测模型
|-- ch_PP-OCRv3_rec_infer/       # 文字识别模型
|-- ch_ppocr_mobile_v2.0_cls_infer/ # 文字方向分类模型
|-- ppocr_keys_v1.txt             # 中文字典

注意:发布时必须保留整个目录,不要只发 exe,否则模型和 DLL 找不到。

五、开发流程 & 核心封装

开发过程主要分四步:

  1. 本地模型验证

    • 准备 Paddle Inference SDK、PaddleOCR C++ 推理代码、OpenCV、模型文件
    • 确认模型能在本机跑通
  2. 封装 OCR 引擎

    • LocalOcrEngine 封装了 OCR 调用逻辑

    • 提供两个接口:

      static OcrResult recognizeFile(const QString &imagePath);
      static OcrResult recognizeImage(const QImage &image);
      
    • 全图和局部识别走同一流程

  3. 接入桌面端操作

    • 加载图片 → 显示 → 旋转 → 选择识别区域 → 调用 OCR → 显示结果
  4. 打包发布目录

    • 将 exe、Qt DLL、OpenCV DLL、Paddle DLL、模型文件整理到最终目录
    • 使用脚本自动处理依赖

六、使用效果 & 小技巧

  • 局部识别:拖拽 + 旋转框即可准确提取文字
  • 全图识别:一键完成,速度快
  • CLI 模式验证:可保存标注图,确认识别效果

Tip:只要下载完整目录,不要只拷 exe,否则模型和 DLL 会找不到。


七、下载体验

  • 解压 → 打开 LocalOcrDemo.exe → 立即开始识别
  • 支持全图 & 局部识别,结果实时显示
  • 下载地址:
我用夸克网盘给你分享了「Qt+PaddleOCR」,点击链接或复制整段内容,打开「夸克网盘APP」即可获取。
/~870e3YdJUf~:/
链接:https://pan.quark.cn/s/217d80a16804

如果你想做 本地 OCR、工业视觉、内网工具,收藏这篇文章。

如果你需要源码或者定制开发、联系博主

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐