1、安装tesseract-ocr-setup-3.05.01.exe文件,安装到能找到地方一直下一步。

2.配置环境变量:
新建系统变量:TESSDATA_PREFIX

C:\Tesseract-OCR\tessdata
将:C:\Tesseract-OCR加入到path

3.pip install pytesseract

4.修改pytesseract.py文件,大概35行,tesseract_cmd = ‘C:\Tesseract-OCR\tesseract.exe’
tesseract_cmd的值是tesseract.exe的绝对路径

5,使用pytesseract

import pytesseract
from PIL import Image

test = Image.open('test2.png','r')
result = pytesseract.image_to_string(test)
print(result)
GitHub 加速计划 / te / tesseract
11
3
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:4 个月前 )
dcb2ef91 add info about using egorpugin/tessdata tessdata_unittest 7 天前
2a944fbe - 9 天前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐