Tesseract-OCR的安装和使用
tesseract
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
项目地址:https://gitcode.com/gh_mirrors/te/tesseract
免费下载资源
·
参考:
Tesseract-OCR的安装和使用
1、Tesseract-OCR安装包的下载:
下载地址:添加链接描述
等待下载完成
2、添加语言包:
语言包下载地址:添加链接描述
语言包下载完成后放入Tesseract-OCR的tessdata中。
3、安装Tesseract-OCR
点击exe可执行文件,进行安装,一直点击next,完成安装。
4、安装完成后配置环境变量
打开此电脑中高级属性设置,
配置环境变量
5、在path变量中增加自己的Tesseract-OCR安装路径
6、添加语言包环境变量;
设置变量名和变量值如下:
变量名:TESSDATA_PREFIX
变量值:D:\Tesseract_OCR\tessdata(自定义的语言包位置)
配置完成后点击确定。
7、测试安装是否成功
win+R,打开cmd
命令行中输入:tesseract --version
8、查看可支持的语言:
命令行中输入:tesseract --list-langs
使用:
1、默认是能识别英文和数字
tesseract 被识别的图片路径 存放识别结果的文本文件路径
2、添加中文语言包后可以识别中文
tesseract 被识别的图片路径 存放识别结果的文本文件路径 -l chi_sim
GitHub 加速计划 / te / tesseract
60.1 K
9.29 K
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:2 个月前 )
bc490ea7
Don't check for a directory, because a symbolic link is also allowed.
Signed-off-by: Stefan Weil <sw@weilnetz.de>
4 个月前
2991d36a - 4 个月前
更多推荐
已为社区贡献2条内容
所有评论(0)