tesseract-ocr安装使用步骤
tesseract
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
项目地址:https://gitcode.com/gh_mirrors/te/tesseract
免费下载资源
·
1、安装tesseract-ocr-setup-3.05.01.exe文件,安装到能找到地方一直下一步。
2.配置环境变量:
新建系统变量:TESSDATA_PREFIX
C:\Tesseract-OCR\tessdata
将:C:\Tesseract-OCR加入到path
3.pip install pytesseract
4.修改pytesseract.py文件,大概35行,tesseract_cmd = ‘C:\Tesseract-OCR\tesseract.exe’
tesseract_cmd的值是tesseract.exe的绝对路径
5,使用pytesseract
import pytesseract
from PIL import Image
test = Image.open('test2.png','r')
result = pytesseract.image_to_string(test)
print(result)
GitHub 加速计划 / te / tesseract
11
3
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:4 个月前 )
dcb2ef91
add info about using egorpugin/tessdata tessdata_unittest 7 天前
2a944fbe - 9 天前
更多推荐
已为社区贡献1条内容
所有评论(0)