利用百度AI开放平台 实现 图片中的文字识别
图片中的文字识别算是人工智能中的一个很常见的需求。当然我们可以自己建立和训练模型来实现文字识别,但是如果有现成的工具,而且还是由Baidu这么一个站在人工智能前沿的巨头开发出的工具(没错,指的就是AI开放平台了),那为什么不用呢?除非是要搞自主知识产权,避免后续产品研发中的商业纠纷,那么作为个人制作一些有用的工具来说,是非常之方便和可信赖的。
本篇博客就简单介绍一下利用百度AI开放平台 实现 图片中的文字识别(当然官方文档中也有相当详细的指引)
一、百度AI开放平台介绍
1. 百度AI开放平台网址为:http://ai.baidu.com/
点击开发资源,可以找到对应AI功能板块的文档和SDK下载
SDK 支持多种语言和开发平台,平台方面包括android和ios,语言方面包括Java,PHP,Python,C++,C#等多种语言。
2. 基本要求
a. 注册百度云用户
b. 使用时需要联网
二、文字识别SDK(本文以Python语言为使用范例)
1. 点击下载文字识别对应的Python SDK文件压缩包,并解压。(无需分python2 或python3,通用支持)
2. 文件夹下会有aip、bin文件夹,以及LICENSE无格式文件,setup.py
3. 安装:如果已安装pip, 执行 pip install baidu-aip 即可,如果已安装setuptools,执行python setup.py install即可。
三、 使用
1. 创建应用
a. 在开放平台→控制台→人脸识别,进入文字识别产品服务界面,点击 创建应用→在必填栏填入内容→立即创建
b. 在应用列表下,可看见刚刚创建的应用,包括应用名称,AppID,API Key和Secret Key,请记下这几串字符,后面有用
2. 在第二步下载的文件夹下创建一个test.py文件,写入如下代码:
from aip import AipOcr# id information (这里就是上面要记下的几串字符,相当于一个访问密钥,)
APP_ID = '1470****'
API_KEY = 'sIsgTwZ57Ho3fKla********'
SECRET_KEY = 'EgBGcwydSwpHNzsfry2dd8pC********'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)# Read Image
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()# Call usual ocr interface
result1 = client.basicGeneral(get_file_content('test.jpg'))
print(result1)result2 = client.basicAccurate(get_file_content('test.jpg'))
print(result2)result3 = client.basicGeneralUrl("http://img1.mydrivers.com/img/20181106/s_a15aa25b973c4f7da898e68c419c8644.jpg")
print(result3)
获得以下输出结果:
{'log_id': 7300777478404048134, 'words_result_num': 2, 'words_result': [{'words': '7364'}, {'words': '识别结果:7364'}]}
{'error_msg': 'No permission to access data', 'error_code': 6}
{'log_id': 1474218340211569542, 'words_result_num': 10, 'words_result': [{'words': '2》《=》'}, {'words': '优秀'}, {'words': '村在线'}, {'words': '智能设备奖'}, {'words': '家电类年度产品奖'}, {'words': '边年度空气净化器'}, {'words': '年度'}, {'words': '用户喜爱奖'}, {'words': '智能空气净化'}, {'words': '极客公园'}]}
以上代码中,test.jpg 为同文件下的图片,"http://img1.mydrivers.com/img/20181106/s_a15aa25b973c4f7da898e68c419c8644.jpg"为网络上的一张图片。
如下
四、结论
从第三步中可以看出,识别结果还是很准确的。
另外为什么 result2 的结果是“{'error_msg': 'No permission to access data', 'error_code': 6}”,这是因为在创建应用的时候,没有勾选“文字精准识别”的复选款,所以应用服务器端未分配这个功能的权限。
五、展望
本篇只是非常简单的利用了一下百度AI开放平台,文字识别下还有更多丰富的功能和玩法,更遑论有语音识别,人脸识别各种应用了。
1. 希望能用自己的代码实现类似的功能,那么百度AI可以作为一个benchmark的存在,做一个对比。
2. 希望百度AI不要太早注重盈利,虽然有些功能已经收费了。。。但起码还是对学习者有很多免费的使用功能的,希望能借助这么一个免费的平台,进一步学习人工智能。
利用百度AI开放平台 实现 图片中的文字识别相关推荐
- 利用百度AI开放平台的语言处理基础技术(Python)
百度AI开放平台是一个年轻的平台,2017年1月发布了词法分析,评论观点对抽取,短文本相似度等5种基础技术接口. 本篇文章使用python接入百度AI评论观点对抽取的接口,进行酒店评论文本数据的观点对 ...
- 利用百度AI开放平台识别干部培训网登录验证码
先说能干啥能干啥,看视频. MyVideo_2 个人测试,百度AI平台验证码识别率还是很高的.下面是视频程序的源代码,欢迎跟大家进行交流. import datetime import json fr ...
- [Python]利用百度AI的ocr实现屏幕内区域文字识别
整体思路 1.[截图](https://blog.csdn.net/weixin_44343083/article/details/112252207) 2.图片压缩(百度的ocr要求图片小于4M) ...
- 软件工程师百度AI开放平台接入指南
版权声明 本文原创作者:谷哥的小弟 作者博客地址:http://blog.csdn.net/lfdfhl 概述 若想利用百度AI开放平台进行软件开发,首先应成为百度AI开放平台的开发者.在此,以图文形 ...
- 关于使用百度AI开放平台
百度AI开放平台 地址:https://cloud.baidu.com/?from=console 1.注册登录 2.右侧点击管理控制台,左侧选择自己需要的模块,创建应用 https://consol ...
- 百度AI开放平台3.0:平等赋能成为百度AI关键词
"让每一位开发者都能平等便捷地获取AI能力是我们的愿景,也是我们的承诺.我们非常感谢各位合作伙伴.开发者使用百度的AI能力,让人们的生活更便捷.让学习更有趣.让企业管理更高效.让人类更健康. ...
- java 百度账号注册界面_基于百度AI开放平台的人脸识别的注册登录(1)
百度ai开放平台首页 2.选择产品服务,人脸与人体识别,人脸识别选项.打开后如图所示 人脸识别 3.点击立即使用 3.jpg 4.点击创捷应用 创建应用 这一页大家按自己需求填写即可 5.创建完成后点 ...
- 图像识别-百度AI开放平台
1.注册百度账号 百度AI 百度智能云 二.获取access_token 使用百度AI开放平台,先创建应用.选择「图像识别」,创建一个新的应用. 三.使用图像识别的接口 1.接口 HTTP 方法:PO ...
- 史上最简单的图像识别-百度AI开放平台
提到图像识别,一般都会想到人工智能.虽然现在人工智能还在发展阶段,但是有些技术已经成熟,比如图像识别.语音识别.百度早在2015年之前就已经推出了AI开放平台,涵盖了语音识别.图像处理.视频技术等等. ...
- 图像识别教程(百度AI开放平台)
百度AI开放平台 官网准备 网址 百度AI开放平台:http://ai.baidu.com/ 登录/注册 没有注册过百度账号可以先去注册一个. 打开控制台 选择图像识别 创建应用 正确填写 得到对应A ...
最新文章
- 介绍一个团队协同管理工具:Leangoo
- echarts formatter_手把手教你玩转echarts(二)折线图
- 获取当前按钮所在行的input_form表单的input上传文件
- [OpenGL ES 03]3D变换:模型,视图,投影与Viewport
- 用Ant编译Flex项目的几点注意事项
- LeetCode 256. 粉刷房子(DP)
- javabean连接mysql数据库,jsp+javabean 链接 mysql 数据库
- 金钱能让人更快乐吗?手把手教你用机器学习找到答案
- firebase使用_如何开始使用Firebase Hosting
- 从零开始学Pytorch(十五)之数据增强
- Android Intent的使用
- Go Elasticsearch 快速入门
- Python:字符串、列表、元组、字典之间的相互转换
- 习题9.38 查找字符串中的数字、字母
- PMP考试难度以及通过率
- EL表达式和JSTL标签库学习总结
- 百趣生物受邀参加代谢组学及脂质组学质谱技术研讨会
- rails kaminari text modify
- 微信小程序开发工具第一次使用,网络连接不上怎么办
- 新人学习java导论