文字识别OCR开源框架的对比--Tesseract vs EasyOCR

tesseract

tesseract-ocr/tesseract: 是一个开源的光学字符识别（OCR）引擎，适用于从图像中提取和识别文本。特点是可以识别多种语言，具有较高的识别准确率，并且支持命令行和API调用。

项目地址：https://gitcode.com/gh_mirrors/te/tesseract

免费下载资源

nidongla

1865人浏览 · 2021-06-27 17:01:43

nidongla · 2021-06-27 17:01:43 发布

前言：

OCR文字识别在目前有着比较好的应用，也出现了很多的文字识别软件，但软件是面向用户的。对于我们技术人员来说，有时难免需要在计算机视觉任务中加入文字识别，如车牌号识别，票据识别等，因此软件对我们是没用的，我们需要自己实现文字识别。

在文字识别方面，主要有两款主流的开源框架Tesseract和EasyOCR。本文讨论了 Tesseract 和 EasyOCR 使用 Python API 之间的主要区别，包括安装、使用示例、准确率和推理速度方面的对比。

使用示例

购物返利 m.cpa5.cn

Tesseract

安装: pip install pytesseract pillow

使用示例：

from PIL import Image

import pytesseract

text=pytesseract.image_to_string(Image.open(filename))

print(text)

这只是一个简单的使用示例，在实际应用中，图像并非理想情况，还需要对图像进行一定的预处理以更好地识别。如去除椒盐噪声，去除干扰物，如在车牌识别中还会利用矩形框检测框出车牌所在位置，并放大，以更好地进行车牌号识别。

EasyOCR

安装：pip install easyocr

使用示例

import easyocr

reader = easyocr.Reader(['ch_sim', 'en'])

text = reader.readtext('filename')

print(text)

注：easyocr还会输出文字在图片中的坐标。

准确率

在参考链接[2]中进行了一项实验，使用1000张含字母的图片和1000张含数字的图片分别使用Tesseract和EasyOCR进行测试。

含字母的输入图像如下图所示：

含数字的输入图像如下图所示：

经过测试得出下面两个开源框架的准确率对比

如上图所示，Tesseract 在字母识别方面做得更好，而 EasyOCR 在数字识别方面做得更好。

此外，它们在识别某些字符时存在完全不同的问题。例如，Tesseract 倾向于将诸如 29977.23 之类的东西识别为 2997.23，或者将carrier 识别为 cartier。另一方面，EasyOCR 更有可能将 94268.1 识别为 94268，或者advances 识别为 atvances。这两个单词识别的举例表明这两个框架对单个字母的识别倾向。

推理速度

在速度方面，Tesseract 在 CPU 上的表现优于 EasyOCR，而 EasyOCR 在 GPU 上的表现更好。

结论

Tesseract 在字母识别方面表现更好，而 EasyOCR 在数字方面表现更好。如果图片包含大量字母，可以考虑 Tesseract。此外，EasyOCR 的输出是小写的。如果大写对处理很重要，还应该使用 Tesseract。另一方面，如果图片中包含大量数字，建议 EasyOCR。

参考链接

https://blog.csdn.net/fatesunlove/article/details/107691665

https://medium.com/swlh/ocr-engine-comparison-tesseract-vs-easyocr-729be893d3ae

在公众号中回复关键字 “技术总结” 可获取以下文章的汇总pdf。

其它文章

计算机视觉专业术语总结(一)构建计算机视觉的知识体系

欠拟合与过拟合技术总结

归一化方法总结

论文创新的常见思路总结

CV方向的高效阅读英文文献方法总结

计算机视觉中的小样本学习综述

知识蒸馏的简要概述

优化OpenCV视频的读取速度

NMS总结

损失函数技术总结

注意力机制技术总结

特征金字塔技术总结

池化技术总结

数据增强方法总结

CNN结构演变总结（一）经典模型

CNN结构演变总结（二）轻量化模型

CNN结构演变总结（三）设计原则

如何看待计算机视觉未来的走向

CNN可视化技术总结（一）-特征图可视化

CNN可视化技术总结（二）-卷积核可视化

CNN可视化技术总结（三）-类可视化

CNN可视化技术总结（四）-可视化工具与项目

GitHub 加速计划 / te / tesseract

60.1 K

9.29 K

下载

最近提交(Master分支：2 个月前 )

bc490ea7 Don't check for a directory, because a symbolic link is also allowed. Signed-off-by: Stefan Weil <sw@weilnetz.de> 4 个月前

2991d36a - 4 个月前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m