windows编译和使用tesseract(C++ api)
tesseract
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
项目地址:https://gitcode.com/gh_mirrors/te/tesseract
免费下载资源
·
1. 详细过程
参见:链接地址
2. 遇到的问题
2.1 问题1
2.1.1 描述
我按照上述链接编译的时候遇到如下错误:
找不到struct Pixaa定义
2.1.2 解决办法
在报错的头文件或者源文件中增加:
#include “pix_internal.h”
2.2 问题2
2.2.1 描述
严重性 代码 说明 项目 文件 行 禁止显示状态
错误 LNK2019 无法解析的外部符号 deflate,函数 zlibCompress 中引用了该符号 yolov5 E:\code\Yolov5_Tensorrt_Win10-master\build\leptonica-1.84.0.lib(zlibmem.obj)
2.2.2 解决办法
该报错是由于缺少zlib库导致的,添加zlib库即可。
2.3 问题3
2.3.1 描述
运行时报如下错误:
Error opening data file E:\code\Yolov5_Tensorrt_Win10-master\build\3rdparty\tesseract-3.05.01/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
2.3.2 解决办法
由于缺少语言包导致报上述错误
下载语言包
https://gitcode.net/mirrors/tesseract-ocr/tessdata/-/blob/master/eng.traineddata
将下载的语言包放到tesseract-3.05.01\tessdata目录下,并在Init时,指定tessdata路径
if (api->Init("E:\\code\\Yolov5_Tensorrt_Win10-master\\build\\3rdparty\\tesseract-3.05.01", "eng")) {
fprintf(stderr, "Could not initialize tesseract.\n");
exit(1);
}
GitHub 加速计划 / te / tesseract
60.1 K
9.29 K
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:2 个月前 )
bc490ea7
Don't check for a directory, because a symbolic link is also allowed.
Signed-off-by: Stefan Weil <sw@weilnetz.de>
4 个月前
2991d36a - 4 个月前
更多推荐
已为社区贡献11条内容
所有评论(0)