使用百度云识别图片中的文字(二):获取图片中的文字

上一篇文章中提到怎样获取access_token。此篇文章就是通过access_token来识别图片中的文字。
先来看看:官方的介绍吧:
本文档主要针对API开发者,描述百度OCR文字识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

在百度云控制台内提交工单,咨询问题类型请选择人工智能-文字识别;
关注公众号“百度OCR文字识别”(同时能及时获取接口升级等信息)
百度AI社区–文字识别官方版块:http://ai.baidu.com/forum/topic/list/164
具有免费调用额度的接口,超过每天的免费额度后会返回错误码:17,错误信息:Open api daily request limit reached(每天流量超限额);
所有图片均需要base64编码、去掉编码头后再进行urlencode。
请注意:上传的图片使用JPG格式可以一定程度上提高识别准确率!
强烈建议:如果您使用OCR的服务,请从文字识别的控制台进入并创建应用
注意!请拒绝使用任何第三方插件使用百度OCR服务

使用第三方非法插件会导致您的AK SK泄露,导致别人可以盗用您的账户进行任意消费! 切勿使用任何第三方插件! 因此导致的账号泄露、恶意消费,请用户自行承担责任。如果您已经使用了相关的插件,建议您立即删除对应appid、更换账户密码、更新所有appid的token,或更换账号!

接口能力
接口名称 接口能力简要描述
通用文字识别 对各类通用场景、文件的识别接口,按行返回识别结果
详情请看:https://ai.baidu.com/docs#/OCR-API/e1bd77f3

coding

需要识别的图片:

代码如下:

import urllib3,base64
from urllib.parse import urlencode
import json
access_token='你的access_token'
#需要一个PoolManager实例来生成请求,由该实例对象处理与线程池的连接以及线程安全的所有细节,不需要任何人为操作:
http=urllib3.PoolManager()
url='https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token='+access_token
f = open('test001.jpg','rb')
#参数image:图像base64编码
img = base64.b64encode(f.read())
params={'image':img}
#对base64数据进行urlencode处理
params=urlencode(params)
request=http.request('POST', url,body=params,headers={'Content-Type':'application/x-www-form-urlencoded'})
#对返回的byte字节进行处理。Python3输出位串,而不是可读的字符串,需要进行转换
result = str(request.data,'utf-8')
#对结果进行格式化,方便查看
result = json.dumps(json.loads(result), indent=4, sort_keys=False, ensure_ascii=False)print(result)

结果如下:

{"log_id": 6445553406230491283,"words_result_num": 12,"words_result": [{"location": {"width": 125,"top": 3,"left": 17,"height": 25},"words": "百度智能云"},{"location": {"width": 28,"top": 58,"left": 33,"height": 14},"words": "总览"},{"location": {"width": 53,"top": 104,"left": 6,"height": 15},"words": "产品服务"},{"location": {"width": 133,"top": 142,"left": 6,"height": 20},"words": "百度机器学习BML"},{"location": {"width": 81,"top": 182,"left": 7,"height": 19},"words": "9语音技术"},{"location": {"width": 78,"top": 222,"left": 7,"height": 19},"words": "⊕人脸识别"},{"location": {"width": 84,"top": 262,"left": 4,"height": 19},"words": "人体分析"},{"location": {"width": 79,"top": 303,"left": 9,"height": 16},"words": "文字识别"},{"location": {"width": 83,"top": 344,"left": 5,"height": 17},"words": "图像识别"},{"location": {"width": 80,"top": 381,"left": 6,"height": 20},"words": "图像搜索"},{"location": {"width": 106,"top": 421,"left": 5,"height": 21},"words": "e图像效果增强"},{"location": {"width": 105,"top": 461,"left": 5,"height": 21},"words": "②自然语言处理"}]
}

对比结果,可知虽然有部分错误,但是基本全部识别出来了。
注意:
通过我的经验可知对于各种正常的文字字体基本上都可以正常识别,但是对于手写的识别就差强人意了。(公正的手写字体除外)

使用百度云识别图片中的文字(二):获取图片中的文字相关推荐

  1. java 获取百度云盘图片_java 利用百度云识别图片文字

    一.百度云使用步骤 1.进入https://console.bce.baidu.com/#/index/overview 登录百度云账号.百度所有账号都是通用的,可以直接利用百度的其他账号(百度网盘. ...

  2. 百度云不限速客户端让你获取SVIP速度

    原地址:https://bbs.feng.com/forum.php?mod=viewthread&tid=11604132&page=1 1. 下载浏览器插件 链接: https:/ ...

  3. JAVA基于百度云文字(车牌、身份证、图片)识别提取

    基于百度云文字(车牌.身份证.图片)识别提取 由于自己想写一个停车场项目,所以去查询了百度API文档,可以实现所有图片中文字的提取,此贴为傻瓜式教程,希望所有像我一样的初学者都可以看懂,有所收获,话不 ...

  4. Java实现百度云OCR接口识别图片文字信息(也包含身份证,银行卡识别,更新添加通用票据识别)

    参考: https://blog.csdn.net/weixin_40165004/article/details/82632229 1.需求背景 因项目需求,需要提取身份证.发票(9/16更新内容) ...

  5. python调用(百度云、腾讯云)API接口表格识别并保存为excel

    Python表格识别 图像识别具有较高的商业价值,本节主要通过python调用(百度云.腾讯云)API接口表格识别并保存为excel分析表格识别的能力: 提示:需分别申请密钥,在相应位置添加自己密钥即 ...

  6. QT 基于 百度云语音识别, 基于网易API 接口的歌曲查询,的音乐播放器。

    1.成果展示: 2.界面操作提示 1.  2种方法把歌曲加入列表, 第一种加入本地资源,第二种 加入网上搜索的歌曲 2.  加入本地资源,点击图片  +  ,然后再本地资源里面添加歌曲 3.  网上搜 ...

  7. AUTOJS利用百度OCR识别找字点击 详细代码

    //此段代码要先在百度智能云上注册并开通百度OCR文字识别,开通方法请自行百度 //https://login.bce.baidu.com/?account=&redirect=http%3A ...

  8. 基于百度云的 AI 接口调用

    基于百度云的 AI 接口调用   人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. ...

  9. 百度人脸识别实现方法

    import java.io.IOException; import java.net.MalformedURLException; import java.net.URL; import net.s ...

最新文章

  1. 【总结】sqli-labs Less(1-35) 小结
  2. linux常用操作命令详解
  3. IOS开发笔记7-C语言基础复习
  4. matlab计算运行时间方法
  5. [HAOI2015][loj2127]按位或
  6. Java代码输出到txt文件(申请专利贴源码的必备利器)
  7. CSS如何水平垂直居中?
  8. 过剩通勤应用——线性规划问题解决开源工具(下篇)
  9. Win10显示文件扩展名
  10. Visual Studio 开发环境安装与配置
  11. c语言王者荣耀程序代码,王者荣耀:张大仙直言C语言上手并不难,玩家:张工程师成了?...
  12. cad户型图练习_我的房子我做主 篇一:技多不压身—业内人士手把手教你学会用CAD绘制户型图...
  13. matlab皮尔森相关系数法,Spearmen相关系数和Pearson相关系数及其MATLAB实现
  14. iOS开发企业版ipa分发
  15. 2020中国隧道与地下工程大会(CTUC)暨中国土木工程学会隧道及地下工程分会第二十一届年会
  16. android mac 照片恢复,万兴安卓照片恢复软件(Mac版本)指南
  17. 视频教程-深度学习与PyTorch入门实战教程-深度学习
  18. Win32关于调整窗口大小时,窗口闪烁问题及解决办法
  19. 嵌入式分享合集128
  20. 纯前端实现登记照压缩宽高体积大小和换装功能

热门文章

  1. matlab画调度甘特图
  2. Excel导入长数据末尾变000
  3. tensorflow2.X 转tflite
  4. 图论将大脑作为一个大型复杂网络的分析——如何构建功能性、结构性脑网络,全局属性,局部属性指标计算
  5. 餐饮油烟在线监控平台助力南京市餐饮油烟治理顺利进行!(安科瑞 须静燕)
  6. 腾讯云技术中台,打破SaaS应用的篱笆墙
  7. java邮箱验证正则表达式_LeetCode 力扣官方题解 | 468.验证 IP 地址
  8. MT6739 Sensor移植
  9. Unity 按键控制相机(移动、旋转、相机角度控制)
  10. 清华深圳研究生院计算机报录比,最新全国各大高校各专业考研报录比率.xls