最近一段时间在研究图像字符识别,查看了很多资料,目前来看运用比较广泛的开源项目便是google接手并优化的tesseract-ocr了。

目前,我还未查清google到底提供了几种使用方式,我经手测试过的有命令行的、android调用jar包,再有为了将OCR识别与前面图像预处理结合到一起测试,所以在VS下编译tesseract-ocr势在必行。

这两天一直再捯饬怎样让开源项目运行在VS2010上,因为google提供的是VS2008版本的,而我的电脑上刚好没有这个,只有VS2010,所以只能想办法编译生成2010下能使用的lib和dll了。
网络中有很多人提出了编译方法,不同的人相似的方法,但是没有一个我能完全走通的。为了弄清楚原因,我决定按部就班的梳理一下编译过程。

GitHub 加速计划 / te / tesseract
60.1 K
9.29 K
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:2 个月前 )
bc490ea7 Don't check for a directory, because a symbolic link is also allowed. Signed-off-by: Stefan Weil <sw@weilnetz.de> 4 个月前
2991d36a - 4 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐