本文创建自己的OCR,实现无限次图片识别,没一个字废话

第 1 步、下载安装 Tesseract,官方链接:点我

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

第 2 步准备添加环境变量

在这里插入图片描述
在这里插入图片描述

添加好后,点击确定

在这里插入图片描述

第 3 步,下载语言包,默认不持支中文,中文包下载:点我

在这里插入图片描述

下载成功

在这里插入图片描述

下载慢的,或者下载不了的,能不能关注+收藏+点赞,然后我就会给你

重要的一步:

下载完成后我们需要将文件内chi_sim.traineddata放到Tesseract的路径下的tessdata目录下

在这里插入图片描述

在这里插入图片描述

实践出真知

在这里插入图片描述

安装
pytesseract pip install pytesseract

import pytesseract
from PIL import Image

img = Image.open("img.png")
string = pytesseract.image_to_string(img, lang='chi_sim')
print(string)
print("----------------------------------------------------------------")
# print(path+img)


识别效果:“一坨屎”,垃圾

在这里插入图片描述

失望

我有后路

调用百度OCR的在这篇文章:点我

调用OCRSpace的在这篇文章:点我

希望对大家有帮助

致力于办公自动化的小小程序员一枚

致力于写出最清楚的博客

都看到这了,关注+点赞+收藏=不迷路!!

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐