使用TESSERACT来识别字符

tesseract

tesseract-ocr/tesseract: 是一个开源的光学字符识别（OCR）引擎，适用于从图像中提取和识别文本。特点是可以识别多种语言，具有较高的识别准确率，并且支持命令行和API调用。

项目地址：https://gitcode.com/gh_mirrors/te/tesseract

免费下载资源

卓晴 · 2020-11-28 22:17:00 发布

➤ 01介绍

使用TESSERTACT来完成OCR。这是一篇来自于网络上通俗讲解博文。 [Tutorial] OCR in Python with Tesseract, OpenCV and Pytesseract

OCR(Optical Charactor Recognition::光学字符识别)是将文字的二维图像转换成字符的过程。可以是打印的文本，也可以是手写的文本，它基本上包括有：

▲ Optical Character Recognition process (Courtesy)

^{▲ Optical Character Recognition process (Courtesy)}

近期基于深度学习的OCR技术解决了传统OCR识别技术中对于字符字体所带来的限制。下面介绍的Tesseract OCR的方法就是其中有代表性的一个。

Tesseract:这是一款在OCR开发者中比较流行的开源OCR识别引擎。某些时候对它的应用和修改显得比较棘手，但在开源环境中长期没有合适可被选用的OCR软件，也只能凑合使用它。本来这款开关项目最初来自于HP公式实验室，是作为博士生课题开展的。在1984到1994年之间的十年期间它逐步流行起来。在2006后Google公司接管了对它的维护。
OCRopus：OCRopus是一款在研究者或者公司应用中比较简便易行。它汇集了文本分析程序，并不是专用的OCR软件。你在使用前有可能需要对图片进行一些预处理，甚至需要重新训练心得模型。
Ocular：适合于对于印刷文档识别，用于多种文字识别。使用命令行进行操作。在传统的OCR系统中，它的性能最好。
SwiftOCR:这是应用Swift编写的ORC识别引擎。据称它的性能超过Tessaract。