参考:
Tesseract-OCR的安装和使用
1、Tesseract-OCR安装包的下载:
下载地址:添加链接描述
在这里插入图片描述
在这里插入图片描述
等待下载完成
2、添加语言包:
语言包下载地址:添加链接描述
在这里插入图片描述
语言包下载完成后放入Tesseract-OCR的tessdata中。
3、安装Tesseract-OCR
点击exe可执行文件,进行安装,一直点击next,完成安装。
4、安装完成后配置环境变量
打开此电脑中高级属性设置,
配置环境变量
在这里插入图片描述
5、在path变量中增加自己的Tesseract-OCR安装路径
在这里插入图片描述
6、添加语言包环境变量;
在这里插入图片描述
设置变量名和变量值如下:
变量名:TESSDATA_PREFIX
变量值:D:\Tesseract_OCR\tessdata(自定义的语言包位置)

在这里插入图片描述
配置完成后点击确定。
7、测试安装是否成功
win+R,打开cmd
命令行中输入:tesseract --version
在这里插入图片描述
8、查看可支持的语言:
命令行中输入:tesseract --list-langs
在这里插入图片描述
使用:
1、默认是能识别英文和数字

tesseract 被识别的图片路径 存放识别结果的文本文件路径

2、添加中文语言包后可以识别中文

tesseract 被识别的图片路径 存放识别结果的文本文件路径 -l chi_sim

GitHub 加速计划 / te / tesseract
60.1 K
9.29 K
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:2 个月前 )
bc490ea7 Don't check for a directory, because a symbolic link is also allowed. Signed-off-by: Stefan Weil <sw@weilnetz.de> 4 个月前
2991d36a - 4 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐