tesseract是谷歌开发并开源的图像文字识别引擎

  1. 首先下载安装程序,分享我的百度云地址 链接:https://pan.baidu.com/s/1AynK4CN936sjfaHyu41WIw
    提取码:7358

  2. 下载后下一步傻瓜式安装即可,需安装到无需管理员权限的纯英文路径下即可

  3. 安装完成后需要添加训练数据的环境变量和可执行程序的环境变量 以TESSDATA_PREFIX为系统环境变量名,D:\tesseract-install\Tesseract-OCR\tessdata为系统环境变量值,其中D:\tesseract-install为程序安装路径
    然后将D:\tesseract-install\Tesseract-OCR添加到path环境变量中即可,在命令行下键入tesseract -v回车后若返回版本信息即安装成功 如果设置环境变量后无效,那么重启机器即可。

  4. 命令行下使用其识别图像文字
    命令行下键入 tesseract 图像文件名 返回识别结果的文件名 即可 将在当前图像文件目录下生成一个txt文件,内容即为识别结果

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐