一、OCR图像识别文字识别

光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。

自然场景文本识别的难度极高,原因包括:图片背景极为丰富,经常面临低亮度、低对比度、光照不均、透视变形和残缺遮挡等问题,而且文本的布局可能存在扭曲、褶皱、换向等问题,其中的文字也可能字体多样、字号字重颜色不一的问题。

在这里插入图片描述

二、使用步骤

1、接口

重要提示:建议使用https协议,当https协议无法使用时再尝试使用http协议

请求方式: POST

https://luckycola.com.cn/aiTools/imgOcr

2、请求参数

重要提醒⚠️:该接口请求参数是multipart/form-data格式⚠️

序号参数是否必须说明
1ColaKey唯一验证ColaKey, 可前往官网获取(http(s): //luckycola.com.cn)
2file需要鉴别的图片资源(png、jpg、jpeg格式),注意:该接口请求参数是multipart/form-data格式
3lang当前检测的图片的内容是中文还是英文,如果是中文该参数值不传即可, 如果是英文传入“eng“,务必正确设置该值

注意!!!: 如果您还没有ColaKey,请先请前往官网个人中心获取
官网地址:http(s): //luckycola.com.cn/

3、请求参数示例

重要提醒⚠️:该接口请求参数是multipart/form-data格式⚠️

在这里插入图片描述

4、接口 返回示例

{
	// 接口返回成功
	"code": 0,
	// 接口返回提示
	"msg": "OCR识别成功",
	"data": {
		// 图片OCR识别出来的文本内容
		"text": "LC 官 网 部 分  、AI 聊 天 接 口"
	}
}

三、支持在线图片OCR识别

如果需要对在线图片进行OCR识别请使用下面这个API

1、使用方式

请求方式: GET

https://luckycola.com.cn/tools/urlocr?ColaKey=你的ColaKey&imgurl=在线图片地址&language=语言类型(eng或chs)
2、参数说明
序号参数是否必须说明
1ColaKey唯一验证ColaKey, 可前往官网获取(http(s): //luckycola.com.cn)
2imgurl在线图片url地址,图片大小不超过1M
3language检测的语言类型,中文(chs)或英文(eng),不传默认是中文
3、请求例子
https://luckycola.com.cn/tools/urlocr?ColaKey=你的ColaKey&imgurl=在线图片地址&language=chs
4、响应例子
{
    "code": 0,
    "msg": "ocr识别成功",
    "data": {
        "ParsedResults": [
            {
                "TextOverlay": {
                    "Lines": [],
                    "HasOverlay": false,
                    "Message": "Text overlay is not provided as it is not requested"
                },
                "TextOrientation": "0",
                "FileParseExitCode": 1,
                // 这是图片识别的结果内容
                "ParsedText": "除了功能齐全的“POST℃CRAPI之外/parse/image,我们还/parse/ImageUrl为GET请求提供了一\r\n",
                "ErrorMessage": "",
                "ErrorDetails": ""
            }
        ],
        "OCRExitCode": 1,
        "IsErroredOnProcessing": false,
        "ProcessingTimeInMilliseconds": "4546",
        "SearchablePDFURL": "Searchable PDF not generated as it was not requested."
    }
}

四、温馨提示

注意以下几点,可以大大提高OCR内容识别的准确性

  1. 被识别图片尽量清晰容易被识别
  2. 被识别图片尽量中的内容尽量集中
  3. 被识别图片尽量中的内容尽量只包含一张语言且api参数正确传入lang对应的值
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐