使用tesseract进行图像识别

sutonline

353人浏览 · 2019-12-13 15:48:14

sutonline · 2019-12-13 15:48:14 发布

使用tesseract进行图像识别

在最近的工作中，遇到一个图像识别的问题。在探索一番opencv失败之后，无奈因为上线时间点的关系只能转用google的图像识别tesseract工具。

这次记录安装记录以防止日后用到。

先上结果:

brew install tesseract
brew install tesseract-lang

就这两条就可以愉快地使用

tesseract 2.jpg -l chi_sim

踩到的坑:

由于是在公司安装，github下载很慢。所以一开始就没装语言，手动去github上开了代理下了master的语言包。使用tesseract --list-langs列出来是有中文包的，但是进行图像识别时又提示不能加载中文语言包。还尝试设置export LANG=C结果也不行。
还有tess4j，但在文档中看到没有支持macosx。一直也没有运行成功。

opencv安装的坑:

ant没有安装，cmake之后没有显示java的module
在添加了user_library_path后System.loadLibrary(NATIVE_LIBRARY_NAME)成功，但是调用报not link到native的错。试了2，3，4三个版本也没有解决。这个坑以后再来填。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

cover

AtomGit 11 月：新一代 AtomGit 平台正式上线！

AtomGit开源社区

cover

YOLO11 与 Wan2.2‑I2V‑A14B 正式上线 AtomGit AI：开启视觉感知与动态生成新纪元！

AtomGit开源社区

cover

G-Star 精选开源项目推荐｜第二期

AtomGit开源社区

所有评论(0)

查看更多评论

sutonline

已为社区贡献3条内容