Tesseract OCR安装与简单使用

tesseract

tesseract-ocr/tesseract: 是一个开源的光学字符识别（OCR）引擎，适用于从图像中提取和识别文本。特点是可以识别多种语言，具有较高的识别准确率，并且支持命令行和API调用。

项目地址：https://gitcode.com/gh_mirrors/te/tesseract

免费下载资源

梦里逆天

12335人浏览 · 2022-08-12 20:34:11

梦里逆天 · 2022-08-12 20:34:11 发布

Tesseract OCR安装与简单使用

1.下载Tesseract OCR

下载地址：https://digi.bib.uni-mannheim.de/tesseract/
在这里插入图片描述

2.安装Tesseract OCR

双击安装程序，进入安装界面。
接受协议，下一步。
选择用户
选择组件
- 如果电脑配置够好、网速够快，可以之间勾选”Additional language data(download)“，下载全部额外的语言数据。
- 直接全选的话，后面下载语言包需要很长时间，导致安装进度缓慢。可以点击“Additional language data(download)”旁边的”+“号，选择几种需要的语言包。
设置安装目录。点击”Next“。
点击”Install“。
等待安装完成。
安装完成。点击”Finish“。
将目录添加到系统环境变量Path
查看版本信息

  tesseract -v

在这里插入图片描述

查看已下载的语言包。

  tesseract --list-langs

在这里插入图片描述

3.文字识别程序编写

安装pytesseract模块

pip install pytesseract

在这里插入图片描述

示例1：

from PIL import Image
import pytesseract


# 添加tesseract的路径
pytesseract.pytesseract.tesseract_cmd = r'D:\software\Tesseract-OCR\tesseract.exe'
"""
image_to_string()：如果识别英文或数字可以不必额外参数，如果识别其他语言则需要加上lang参数
lang='chi_sim'表示要识别的是中文简体
没有识别出来时，返回空白
"""
text = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(text)

test.jpg：
在这里插入图片描述
识别效果：

示例2：

test2.jpg：

识别效果：
示例3

test4.png：

识别效果：

参考文章：

GitHub 加速计划 / te / tesseract

下载

最近提交(Master分支：3 个月前 )

bc490ea7 Don't check for a directory, because a symbolic link is also allowed. Signed-off-by: Stefan Weil <sw@weilnetz.de> 5 个月前

2991d36a - 5 个月前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m