01介绍


使用TESSERTACT来完成OCR。这是一篇来自于网络上通俗讲解博文。 [Tutorial] OCR in Python with Tesseract, OpenCV and Pytesseract

OCR(Optical Charactor Recognition::光学字符识别)是将文字的二维图像转换成字符的过程。可以是打印的文本,也可以是手写的文本,它基本上包括有:

  • 图像的预处理
  • 文字定位;
  • 字符分割;
  • 字符识别;
  • 后处理。

▲ Optical Character Recognition process (Courtesy)

▲ Optical Character Recognition process (Courtesy)

近期基于深度学习的OCR技术解决了传统OCR识别技术中对于字符字体所带来的限制。下面介绍的Tesseract OCR的方法就是其中有代表性的一个。

 

02开源OCR工具软件


  • Tesseract:这是一款在OCR开发者中比较流行的开源OCR识别引擎。某些时候对它的应用和修改显得比较棘手,但在开源环境中长期没有合适可被选用的OCR软件,也只能凑合使用它。本来这款开关项目最初来自于HP公式实验室,是作为博士生课题开展的。在1984到1994年之间的十年期间它逐步流行起来。在2006后Google公司接管了对它的维护。
  • OCRopus:OCRopus是一款在研究者或者公司应用中比较简便易行。它汇集了文本分析程序,并不是专用的OCR软件。你在使用前有可能需要对图片进行一些预处理,甚至需要重新训练心得模型。
  • Ocular:适合于对于印刷文档识别,用于多种文字识别。使用命令行进行操作。在传统的OCR系统中,它的性能最好。
  • SwiftOCR:这是应用Swift编写的ORC识别引擎。据称它的性能超过Tessaract。

 

03 Tesseract OCR


▲ Tesseract 处理流程

▲ Tesseract 处理流程

GitHub 加速计划 / te / tesseract
60.1 K
9.29 K
下载
tesseract-ocr/tesseract: 是一个开源的光学字符识别(OCR)引擎,适用于从图像中提取和识别文本。特点是可以识别多种语言,具有较高的识别准确率,并且支持命令行和API调用。
最近提交(Master分支:2 个月前 )
bc490ea7 Don't check for a directory, because a symbolic link is also allowed. Signed-off-by: Stefan Weil <sw@weilnetz.de> 4 个月前
2991d36a - 4 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐