图片中的文字识别算是人工智能中的一个很常见的需求。当然我们可以自己建立和训练模型来实现文字识别,但是如果有现成的工具,而且还是由Baidu这么一个站在人工智能前沿的巨头开发出的工具(没错,指的就是AI开放平台了),那为什么不用呢?除非是要搞自主知识产权,避免后续产品研发中的商业纠纷,那么作为个人制作一些有用的工具来说,是非常之方便和可信赖的。

本篇博客就简单介绍一下利用百度AI开放平台 实现 图片中的文字识别(当然官方文档中也有相当详细的指引)

一、百度AI开放平台介绍

1.  百度AI开放平台网址为:http://ai.baidu.com/

点击开发资源,可以找到对应AI功能板块的文档和SDK下载

SDK 支持多种语言和开发平台,平台方面包括android和ios,语言方面包括Java,PHP,Python,C++,C#等多种语言。

2. 基本要求

a. 注册百度云用户

b. 使用时需要联网

二、文字识别SDK(本文以Python语言为使用范例)

1. 点击下载文字识别对应的Python SDK文件压缩包,并解压。(无需分python2 或python3,通用支持)

2. 文件夹下会有aip、bin文件夹,以及LICENSE无格式文件,setup.py

3. 安装:如果已安装pip, 执行 pip install baidu-aip 即可,如果已安装setuptools,执行python setup.py install即可。

三、 使用

1. 创建应用

a. 在开放平台→控制台→人脸识别,进入文字识别产品服务界面,点击 创建应用→在必填栏填入内容→立即创建

b. 在应用列表下,可看见刚刚创建的应用,包括应用名称,AppID,API Key和Secret Key,请记下这几串字符,后面有用

2. 在第二步下载的文件夹下创建一个test.py文件,写入如下代码:

from aip import AipOcr# id information (这里就是上面要记下的几串字符,相当于一个访问密钥,)
APP_ID = '1470****'
API_KEY = 'sIsgTwZ57Ho3fKla********'
SECRET_KEY = 'EgBGcwydSwpHNzsfry2dd8pC********'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)# Read Image
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()# Call usual ocr interface
result1 = client.basicGeneral(get_file_content('test.jpg'))
print(result1)result2 = client.basicAccurate(get_file_content('test.jpg'))
print(result2)result3 = client.basicGeneralUrl("http://img1.mydrivers.com/img/20181106/s_a15aa25b973c4f7da898e68c419c8644.jpg")
print(result3)

获得以下输出结果:

{'log_id': 7300777478404048134, 'words_result_num': 2, 'words_result': [{'words': '7364'}, {'words': '识别结果:7364'}]}
{'error_msg': 'No permission to access data', 'error_code': 6}
{'log_id': 1474218340211569542, 'words_result_num': 10, 'words_result': [{'words': '2》《=》'}, {'words': '优秀'}, {'words': '村在线'}, {'words': '智能设备奖'}, {'words': '家电类年度产品奖'}, {'words': '边年度空气净化器'}, {'words': '年度'}, {'words': '用户喜爱奖'}, {'words': '智能空气净化'}, {'words': '极客公园'}]}

以上代码中,test.jpg 为同文件下的图片,"http://img1.mydrivers.com/img/20181106/s_a15aa25b973c4f7da898e68c419c8644.jpg"为网络上的一张图片。

如下

四、结论

从第三步中可以看出,识别结果还是很准确的。

另外为什么 result2 的结果是“{'error_msg': 'No permission to access data', 'error_code': 6}”,这是因为在创建应用的时候,没有勾选“文字精准识别”的复选款,所以应用服务器端未分配这个功能的权限。

五、展望

本篇只是非常简单的利用了一下百度AI开放平台,文字识别下还有更多丰富的功能和玩法,更遑论有语音识别,人脸识别各种应用了。

1. 希望能用自己的代码实现类似的功能,那么百度AI可以作为一个benchmark的存在,做一个对比。

2. 希望百度AI不要太早注重盈利,虽然有些功能已经收费了。。。但起码还是对学习者有很多免费的使用功能的,希望能借助这么一个免费的平台,进一步学习人工智能。

利用百度AI开放平台 实现 图片中的文字识别相关推荐

  1. 利用百度AI开放平台的语言处理基础技术(Python)

    百度AI开放平台是一个年轻的平台,2017年1月发布了词法分析,评论观点对抽取,短文本相似度等5种基础技术接口. 本篇文章使用python接入百度AI评论观点对抽取的接口,进行酒店评论文本数据的观点对 ...

  2. 利用百度AI开放平台识别干部培训网登录验证码

    先说能干啥能干啥,看视频. MyVideo_2 个人测试,百度AI平台验证码识别率还是很高的.下面是视频程序的源代码,欢迎跟大家进行交流. import datetime import json fr ...

  3. [Python]利用百度AI的ocr实现屏幕内区域文字识别

    整体思路 1.[截图](https://blog.csdn.net/weixin_44343083/article/details/112252207) 2.图片压缩(百度的ocr要求图片小于4M) ...

  4. 软件工程师百度AI开放平台接入指南

    版权声明 本文原创作者:谷哥的小弟 作者博客地址:http://blog.csdn.net/lfdfhl 概述 若想利用百度AI开放平台进行软件开发,首先应成为百度AI开放平台的开发者.在此,以图文形 ...

  5. 关于使用百度AI开放平台

    百度AI开放平台 地址:https://cloud.baidu.com/?from=console 1.注册登录 2.右侧点击管理控制台,左侧选择自己需要的模块,创建应用 https://consol ...

  6. 百度AI开放平台3.0:平等赋能成为百度AI关键词

    "让每一位开发者都能平等便捷地获取AI能力是我们的愿景,也是我们的承诺.我们非常感谢各位合作伙伴.开发者使用百度的AI能力,让人们的生活更便捷.让学习更有趣.让企业管理更高效.让人类更健康. ...

  7. java 百度账号注册界面_基于百度AI开放平台的人脸识别的注册登录(1)

    百度ai开放平台首页 2.选择产品服务,人脸与人体识别,人脸识别选项.打开后如图所示 人脸识别 3.点击立即使用 3.jpg 4.点击创捷应用 创建应用 这一页大家按自己需求填写即可 5.创建完成后点 ...

  8. 图像识别-百度AI开放平台

    1.注册百度账号 百度AI 百度智能云 二.获取access_token 使用百度AI开放平台,先创建应用.选择「图像识别」,创建一个新的应用. 三.使用图像识别的接口 1.接口 HTTP 方法:PO ...

  9. 史上最简单的图像识别-百度AI开放平台

    提到图像识别,一般都会想到人工智能.虽然现在人工智能还在发展阶段,但是有些技术已经成熟,比如图像识别.语音识别.百度早在2015年之前就已经推出了AI开放平台,涵盖了语音识别.图像处理.视频技术等等. ...

  10. 图像识别教程(百度AI开放平台)

    百度AI开放平台 官网准备 网址 百度AI开放平台:http://ai.baidu.com/ 登录/注册 没有注册过百度账号可以先去注册一个. 打开控制台 选择图像识别 创建应用 正确填写 得到对应A ...

最新文章

  1. 介绍一个团队协同管理工具:Leangoo
  2. echarts formatter_手把手教你玩转echarts(二)折线图
  3. 获取当前按钮所在行的input_form表单的input上传文件
  4. [OpenGL ES 03]3D变换:模型,视图,投影与Viewport
  5. 用Ant编译Flex项目的几点注意事项
  6. LeetCode 256. 粉刷房子(DP)
  7. javabean连接mysql数据库,jsp+javabean 链接 mysql 数据库
  8. 金钱能让人更快乐吗?手把手教你用机器学习找到答案
  9. firebase使用_如何开始使用Firebase Hosting
  10. 从零开始学Pytorch(十五)之数据增强
  11. Android Intent的使用
  12. Go Elasticsearch 快速入门
  13. Python:字符串、列表、元组、字典之间的相互转换
  14. 习题9.38 查找字符串中的数字、字母
  15. PMP考试难度以及通过率
  16. EL表达式和JSTL标签库学习总结
  17. 百趣生物受邀参加代谢组学及脂质组学质谱技术研讨会
  18. rails kaminari text modify
  19. 微信小程序开发工具第一次使用,网络连接不上怎么办
  20. 新人学习java导论

热门文章

  1. 在树莓派上配置迅雷远程下载
  2. matlab矩阵里面星号,矩阵中出现加号和星号 什么意思
  3. 蓝桥杯第七届省赛 模拟风扇控制系统 by YYC
  4. 读July关于概率论所想
  5. 什么是Rootkit病毒
  6. 嵌入式学习——c的复习
  7. PostgreSQL 设置远程访问
  8. win7系统提示“此windows副本不是正版” 解决方案
  9. [转贴]杨式太极拳八十五式通释—3—王志远
  10. 使用 pandoc 进行文档转换(markdown转pdf)