使用TESSERACT来识别字符
tesseract
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
项目地址:https://gitcode.com/gh_mirrors/te/tesseract
免费下载资源
·
➤ 01介绍
使用TESSERTACT来完成OCR。这是一篇来自于网络上通俗讲解博文。 [Tutorial] OCR in Python with Tesseract, OpenCV and Pytesseract
OCR(Optical Charactor Recognition::光学字符识别)是将文字的二维图像转换成字符的过程。可以是打印的文本,也可以是手写的文本,它基本上包括有:
- 图像的预处理
- 文字定位;
- 字符分割;
- 字符识别;
- 后处理。
▲ Optical Character Recognition process (Courtesy)
近期基于深度学习的OCR技术解决了传统OCR识别技术中对于字符字体所带来的限制。下面介绍的Tesseract OCR的方法就是其中有代表性的一个。
➤ 02开源OCR工具软件
- Tesseract:这是一款在OCR开发者中比较流行的开源OCR识别引擎。某些时候对它的应用和修改显得比较棘手,但在开源环境中长期没有合适可被选用的OCR软件,也只能凑合使用它。本来这款开关项目最初来自于HP公式实验室,是作为博士生课题开展的。在1984到1994年之间的十年期间它逐步流行起来。在2006后Google公司接管了对它的维护。
- OCRopus:OCRopus是一款在研究者或者公司应用中比较简便易行。它汇集了文本分析程序,并不是专用的OCR软件。你在使用前有可能需要对图片进行一些预处理,甚至需要重新训练心得模型。
- Ocular:适合于对于印刷文档识别,用于多种文字识别。使用命令行进行操作。在传统的OCR系统中,它的性能最好。
- SwiftOCR:这是应用Swift编写的ORC识别引擎。据称它的性能超过Tessaract。
➤ 03 Tesseract OCR
▲ Tesseract 处理流程
GitHub 加速计划 / te / tesseract
60.1 K
9.29 K
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:2 个月前 )
bc490ea7
Don't check for a directory, because a symbolic link is also allowed.
Signed-off-by: Stefan Weil <sw@weilnetz.de>
4 个月前
2991d36a - 4 个月前
更多推荐
已为社区贡献69条内容
所有评论(0)