【Python】 Tesseract 的安装和基础功能使用

DO?OK:NOT

1279人浏览 · 2022-04-27 16:13:39

DO?OK:NOT · 2022-04-27 16:13:39 发布

文章目录

前言
一、安装Tesseract
二、python 库的安装
- 1.示例代码。
- 2.异常处理
总结

前言

使用了很多的python 三方库来做图片文字的识别，发现不尽人意，最后的最后还是不得不安装Tesseract来配合python

一、安装Tesseract

下载地址：选择自己需要的和适合的版本下载
注意：
在安装的过程中可以选择自己需要的语言包，比如中文等。（也可以本地配置语言包，根据自己的需求来编写）
不要按照图片中的选择那么多哦
还需要把安装的目录配置到环境变量，如图：
在这里插入图片描述

二、python 库的安装

需要安装两个库；

pip install pytesseract -i https://pypi.tuna.tsinghua.edu.cn/simple 
pip install pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

1.示例代码。

代码如下（示例）：

import os

import pytesseract
from PIL import Image
# 列出支持的语言
print(pytesseract.get_languages(config=''))
print(pytesseract.image_to_string(Image.open(r"C:\Users\Administrator\Desktop\95db25e4060f12ac18ed264f55d41b9.jpg"), lang='chi_sim+eng'))

2.异常处理

运行起来的时候出现异常：

tesseract is not installed or it's not in your path

需要修改源代码的 pytesseract.py 文件

tesseract_cmd = r'tesseract.exe' # 原来的
tesseract_cmd = r'E:\app_install\pyocr\tesseract.exe' # 修改为你的地址

总结

有疑问！请留言！！！！！尽力回复！！！！！

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

SCI论文快速写作指南：沁言学术实用方法

在SCI论文写作领域，尤其针对CSDN社区内的计算机科学、AI和算法优化研究者，高效方法的应用已成为提升投稿成功率的关键。AI工具的整合能显著优化从检索到润色的流程。本文基于公开调研数据和用户案例，剖析SCI写作难点，并以沁言学术为例，探讨实用方法与技术机制。重点在于算法深度与效率insights，旨在为CSDN用户提供可操作的指导，帮助科研人员加速SCI论文产出。

GitCode 开源社区

仓颉共学创作营正式启动！邀您共探新兴技术，解锁仓颉创作红利

GitCode 开源社区

高校科研团队文献协作工具推荐

在高校科研团队中，尤其针对CSDN社区内的计算机科学、AI和大数据领域，文献协作是推动项目进展的核心。传统方法往往因信息孤岛和版本冲突而低效，AI工具的引入能优化这一流程。本文基于公开调研数据和用户案例，剖析协作痛点，并以沁言学术为例，探讨其功能机制与应用策略。重点在于技术深度与团队insights，旨在为CSDN用户提供可借鉴的路径，帮助科研团队提升文献协作效率。