tesseract第三方图文验证码识别用法
·
一.tesseract的安装

下载这个压缩包即可
解压后直接双击文件夹内的.exe文件安装就好了,安装完后需要开始配置环境变量,就是把你安装tesseract的安装路径复制到环境变量中


在cmd里面输入如下代码,如果出现下方的4.00.00的版本号说明安装成功
二.在cmd中测试tesseact的识别率
下面我在cmd中来测试一下这个开源的验证码识别率,就以下面三张图片为例
可以看出此次识别与实际不一样第二张也未能识别
此处才识别成功,可以看到这个开源的验证码识别器的识别率只有30%-50%左右
三.在pycharm中使用tesseract识别
在使用之前需要先安装两个库(pytesseract 和pillow)



四.总结
总结 : 通过以上测试这个开源的验证码识别率太低,所以我们在今后的数据抓取在需要验证码识别时,不推荐使用tesseract,在下一张我会给大家继续更新,去使用我们第三方的打码平台,它的识别率可以达到80%-90%,给个三连支持一下吧
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




第二张也未能识别

所有评论(0)