在 OCR 技术落地过程中,Java 开发者常面临 "Python 生态繁荣,Java 集成困难" 的困境 —— 要么依赖jni调用 exe/dll 外部文件,要么跨平台部署踩坑不断。

一.在之前版本的基础上进行了核心优化与新增功能

  • 🔧 内存优化:修复多处内存泄漏问题,提升大批量、长时间识别任务的稳定性
  • 📋 表格结果升级:表格识别除原有HTML格式外,新增行列结构化JSON数据返回,可直接解析获取精准行列信息。
  • ⏹️新增任务取消能力:支持识别过程中手动取消长耗时任务,灵活适配业务中断场景
  • 🧵 多线程适配优化:完善多线程批量识别能力,支持并发处理多文件、多图片识别任务
  • 🖥️ 全架构兼容:完整支持 x86_64、ARM 硬件架构
  • 🇨🇳 信创环境适配:深度适配国产操作系统、ARM 信创服务器与终端,满足国产化项目落地要求

二.下载核心 Jar 包

前往 GitHub 仓库JiaJiaOCR releases 页面,下载 JiaJiaOCR 2.0 + 版本的 jar 包,放入项目依赖目录并引入。该 Jar 包 200MB(集成了模型文件)。【下载地址:https://github.com/jiangnanboy/JiaJiaOCR

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐