Windows下的Tesseract的配置安装与使用
tesseract
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
项目地址:https://gitcode.com/gh_mirrors/te/tesseract
免费下载资源
·
1.下载Tesseract安装包
大家可以去官网下载,也可以上软件园下载,主要看速度了。
这里提供了我的网盘供大家下载:
链接: https://pan.baidu.com/s/1oEsV-ORJ75y1SsMpPN6Nog
提取码: ju4w
2.安装
一直按next就行了,因为无法连接到Tesseract的服务器,所以无法在安装的时候选择下载多语言,有需要的话可以在网上额外下载,这里先不考虑。
3.配置环境变量
这里填上刚才安装Tesseract的目录,一般默认是D:\Program Files (x86)\Tesseract-OCR
测试环境变量
打开CMD,输入tesseract -v,如果出现一下内容则说明配置成功
开始识别图像,以下图为例
这里暂时只支持英文,如果希望识别其他语言的,需要去网上下载安装包。
把图片放好,建议放在全英文的路径下。
进入cmd
输入cd /
进入D盘
输入cd 空一格,把文件夹拖进cmd里面,可以快速进入文件夹。
开始图像识别
输入tesseract 图像名 结果输出文件名
例如
tesseract timg[8].jpg result6
查看result6.txt文件
成功识别
GitHub 加速计划 / te / tesseract
11
3
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:3 个月前 )
bc490ea7
Don't check for a directory, because a symbolic link is also allowed.
Signed-off-by: Stefan Weil <sw@weilnetz.de>
5 个月前
2991d36a - 5 个月前
更多推荐
已为社区贡献2条内容
所有评论(0)