Python+Tesseract实现自己的OCR无限次识别(保姆级)

一晌小贪欢

641人浏览 · 2023-03-23 17:54:09

一晌小贪欢 · 2023-03-23 17:54:09 发布

本文创建自己的OCR，实现无限次图片识别，没一个字废话

第 1 步、下载安装 Tesseract，官方链接：点我

在这里插入图片描述

第 2 步准备添加环境变量

在这里插入图片描述

添加好后，点击确定

在这里插入图片描述

第 3 步，下载语言包，默认不持支中文，中文包下载：点我

在这里插入图片描述

下载成功

在这里插入图片描述

下载慢的，或者下载不了的，能不能关注+收藏+点赞，然后我就会给你

重要的一步：

`下载完成后我们需要将文件内chi_sim.traineddata放到Tesseract的路径下的tessdata目录下`

在这里插入图片描述

实践出真知

在这里插入图片描述

库	安装
pytesseract	pip install pytesseract


import pytesseract
from PIL import Image

img = Image.open("img.png")
string = pytesseract.image_to_string(img, lang='chi_sim')
print(string)
print("----------------------------------------------------------------")
# print(path+img)

识别效果：“一坨屎”，垃圾

在这里插入图片描述

失望

我有后路

调用`百度OCR`的在这篇文章：点我

调用`OCRSpace`的在这篇文章：点我

希望对大家有帮助

致力于办公自动化的小小程序员一枚

致力于写出最清楚的博客

都看到这了，关注+点赞+收藏=不迷路！！

GitCode 开源社区

新一代开源开发者平台 GitCode，通过集成代码托管服务、代码仓库以及可信赖的开源组件库，让开发者可以在云端进行代码托管和开发。旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

混元世界模型 1.1 在 GitCode 开源！秒级生成 3D 世界，开发者速来体验！

GitCode 开源社区

我的第一个开源项目｜PyRemote：从百行脚本到 5000 Star 的星火燎原之路

GitCode 开源社区

华为盘古 Ultra-MoE-718B-V1.1 正式开放下载！

👉Int8量化版本也同步开源：https://gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1-Int8还记得9月底刷屏的「华为盘古718B」吗？当时凭借的训练哲学，在 SuperCLUE 榜单中一举冲至开源模型第三，成为业界焦点。openPangu-Ultra-MoE-718B-V1.1 是基于昇腾 NPU 训练的大规模混合专家（Mo