2019年7月3日早上,在百度AI开发者大会上,一个来自山西的青年,将一瓶矿泉水浇在了同样来自山西的李彦宏身上。

可以回顾一下 https://b23.tv/av57665929/p1 ,着实让人一惊,这么大的会议上既然让人这么容易接近大佬。

(图片来源网络)

OCR识别准备工作

百度云真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别、MQTT服务器、语音识别等等,应有尽有吧

看看OCR识别免费的量

第一步:

创建一个文字识别的应用,也就是向百度云申请一个文字识别的用户接口

第二步:

打开技术文档,基本涵盖了当今流行的编程语言

C++SDK文档              Android-SDK文档        Java-SDK文档         Node-SDK文档

PHP-SDK文档             Python-SDK文档          C#SDK文档               iOS-SDK文档

第三步:

安装OCR Python SDK,OCR Python SDK目录结构

├── README.md

├── aip //SDK目录

│ ├── __init__.py //导出类

│ ├── base.py //aip基类

│ ├── http.py //http请求

│ └── ocr.py //OCR

└── setup.py //setuptools安装

支持Python版本:2.7.+ ,3.+

安装命令:

在win10环境下通过cmd安装后需要关掉当前cmd窗口,重新打开cmd窗口进行命令执行python程序方可正确实现

pip install baidu-aip

测试代码

通用文字识别

from aip import AipOcr

#更换为自己的注册信息

APP_ID = '---'

API_KEY = '---'

SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接

fp=open("tu2.png","rb").read()#打开并读取文件内容

res=client.basicGeneral(fp)#普通

#print(res)

#将所有的文字都合并到一起

strx=""

for tex in res["words_result"]:#遍历结果

strx+=tex["words"]#每一行

print(strx)#输出内容

通用文字识别(高精度版)

from aip import AipOcr

#更换为自己的注册信息

APP_ID = '---'

API_KEY = '---'

SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接

fp=open("tu2.png","rb").read()#打开并读取文件内容

#res=client.basicGeneral(fp)#普通

res=client.basicAccurate(fp)#高精度

#print(res)

#将所有的文字都合并到一起

strx=""

for tex in res["words_result"]:#遍历结果

strx+=tex["words"]#每一行

print(strx)#输出内容

URL图片地址方式

from aip import AipOcr

#更换为自己的注册信息

APP_ID = '----'

API_KEY = '----'

SECRET_KEY = '-----'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接

url = "//bbsmax.ikafan.com/static/L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vYmxvZy8xNDg1MjAyLzIwMTkwNy8xNDg1MjAyLTIwMTkwNzA1MjEwNDQ1NjQ5LTIwOTM2NzI3NzIucG5n.jpg"

res=client.basicGeneralUrl(url)#普通

#print(res)

#将所有的文字都合并到一起

strx=""

for tex in res["words_result"]:#遍历结果

strx+=tex["words"]

print(strx)#输出内容

注意

图片格式(image):

图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式

URL格式(url):

图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,当image字段存在时url字段失效

语言设置(language_type)

识别语言类型,默认为CHN_ENG

可设置:- CHN_ENG:中英文混合;- ENG:英文;- POR:葡萄牙语;- FRE:法语;- GER:德语;- ITA:意大利语;- SPA:西班牙语;- RUS:俄语;- JAP:日语;- KOR:韩语;

图像倒置设置(detect_direction)

是否检测图像朝向,默认不检测,即:false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括:- true:检测朝向;- false:不检测朝向

是否检测语言(detect_language)

是否检测语言,默认不检测。当前支持(中文、英语、日语、韩语),值为flase或者true

是否返回识别结果中每一行的置信度(probability)

值为flase或者true

参数添加举例

""" 如果有可选参数 """

options = {}

options["detect_direction"] = "true"

options["detect_language"] = "true"

""" 带参数调用网络图片文字识别, 图片参数为远程url图片 """

client.webImageUrl(url, options)

更多参考:

spring boot2 基于百度云apiface实现人脸检测与认证1

原理介绍: 基于百度云的人脸资料库(用户上传),调用本地摄像头抓拍的图像,与百度云的用户图像做比对,实现人脸认证. 主要步骤如下: 1. 创建百度去账号 2. 在百度云控制台中创建人脸识别的应用,并记 ...

Android 高仿微信实时聊天 基于百度云推送

转载请标明出处:http://blog.csdn.net/lmj623565791/article/details/38799363 ,本文出自:[张鸿洋的博客] 一直在仿微信界面,今天终于有幸利用百 ...

python基于百度AI开发文字识别

很多场景都会用到文字识别,比如app或者网站里都会上传身份证等证件以及财务系统识别报销证件等等 第一步,你需要去百度AI里去注册一个账号,然后新建一个文字识别的应用 然后你将得到一个API Key 和 ...

OCR识别-python版(一)

需求:识别图片中的文字信息环境:windows系统 开发语言:python 使用工具类:1.pyocr 2.PIL 3.tesseract-ocr 步骤: 1.pyocr 网络通直接使用命令:pip ...

spring boot2 基于百度云apiface实现人脸检测与认证2

接上一篇,上篇只实现了人脸的认证,接下来实现人脸的检测. 原理介绍: 把摄像头抓拍的图像上传到服务器,服务器把图像上传到百度云,百度云返回识别出的人脸的数量和位置,前端根据服务端的返回,在图像中画出人 ...

基于百度AI实现 车牌识别

前言 目前百度的AI接口相对完善,对于文字识别类的操作还需要开发者一一去尝试,去评估这效果到底是怎么的. 文字识别的接口相对简单,官方提供的SDK也集成很好,笔者只是在这上面做了一些前期性的功能数据校 ...

联想A798T刷机包 基于百度云V6 集成RE3.1.7美化版 精简冗余文件

ROM介绍 1.apk进行odex合并及zipaliang优化-省电及降低内存暂用. 2.測试相机.通话.数据.wifi.蓝牙.等传感器均正常,. 3.提供时间居中防iphone状态栏补丁 4.增加I ...

基于阿里云平台的使用python脚本发送短信

第一步:点击短信服务下的帮助文档 第二步:安装python的SDK:点击安装python sdk 第三步:直接通过python的pip工具安装即可,方便快捷: 第四步:点击红框进行测试: 第五步:测试 ...

基于百度AI开放平台的人脸识别及语音合成

基于百度AI的人脸识别及语音合成课题 课题需求 (1)人脸识别 在Web界面上传人的照片,后台使用Java技术接收图片,然后对图片进行解码,调用云平台接口识别人脸特征,接收平台返回的人员年龄.性别.颜 ...

随机推荐

为html.EditorFor添加样式

有网友问及,怎样为html.EditorFor添加样式. 解决方法,可以参考下面语法: 先new一个htmlAttributes. @model Book @using Insus.NET.Model ...

两个二进制数多少个位(bit)不同

class Solution { public: /** * 获得两个整形二进制表达位数不同的数量 * * @param m 整数m * @param n 整数n * @return 整型 */ in ...

修改CSV中的某些值 -- 1

修改前: col1,col2,col3,col4 text1,text2,text3,text4 text5,text6,text7,text8 text9,text10,text11,text12 ...

文档在线预览开源实现方案一:OpenOffice + SwfTools + FlexPaper

在文档在线预览方面,项目组之前使用的是Microsoft office web apps, 由于该方案需要按照微软License付费,项目经理要我预研一个文档在线预览的开源实现方案.仔细钻入该需求发现 ...

bind,apply,call区别总结

Java字节码里的invoke操作&&编译时的静态绑定与动态绑定

一个一直运行正常的应用突然无法运行了.在类库被更新之后,返回下面的错误. Exception in thread "main" java.lang.NoSuchMethodErro ...

three.js学习:初学three.js,从立方体开始

目前three.js是浏览器展现3D效果的一个很强大的js工具,遗憾的是没有特别系统而全面的文档(threejs官方文档感觉有些缺漏,可以和WebGL中文网的threejs教程对比着看).好了,根据W ...

mysql数据库索引相关

一 介绍 什么是索引? 索引在MySQL中也叫做“键”,是存储引擎用于快速找到记录的一种数据结构.索引对于良好的性能非常关键,尤其是当表中的数据量越来越大时,索引对于性能的影响愈发重要.索引优化应该是 ...

spring boot之使用通用Mapper批量添加数据

通用Mapper是一款针对mybatis进行扩展的轻量级组件,使用起来非常方便.当调用其针对mysql进行批量添加数据的方法时,发现报错,仔细研究了一番,发现是在使用通用Mapper上出现了问题.下面 ...

本地schemeApp扩展

作者:ani_di 版权所有,转载务必保留此链接 http://blog.csdn.net/ani_di 本地schemeApp扩展 iHasApp这个用过的话,大概知道我说的是什么了. scheme ...

python百度云ocr文字识别软件_基于百度云的OCR识别(Python)相关推荐

  1. 用paddleocr识别汉字_基于Paddle的截图OCR文字识别的实现

    一款截图识别文字的OCR工具主要涉及2个环境:截图 OCR识别 前要 OCR的应用场景 根据OCR的应用场景而言,我们可以大致分成识别特定场景下的专用OCR以及识别多种场景下的通用OCR.就前者而言, ...

  2. python人脸识别库_基于facenet的实时人脸识别系统

    facenet_facerecognition opencv+mtcnn+facenet+python+tensorflow 实现实时人脸识别 Abstract:本文记录了在学习深度学习过程中,使用o ...

  3. python神经网络库识别验证码_基于TensorFlow 使用卷积神经网络识别字符型图片验证码...

    本项目使用卷积神经网络识别字符型图片验证码,其基于TensorFlow 框架.它封装了非常通用的校验.训练.验证.识别和调用 API,极大地减低了识别字符型验证码花费的时间和精力. 项目地址:http ...

  4. 木杉ocr文字提取软件使用教程

    木杉ocr文字提取软件使用教程 软件下载地址:https://pan.baidu.com/s/1Lm1FcI9lrOTwng_rtjWP9A 提取码:wy8x 2022-04-01 更新1.0.5 解 ...

  5. 【小样本实体识别】Few-NERD——基于N-way K-shot的实体识别数据集和方法介绍

    [小样本实体识别]Few-NERD--基于N-way K-shot的实体识别数据集和方法介绍 前记:   实体识别是信息抽取领域中比较重要的任务,其在学术界和工业界都是有很广泛的应用前景.但是当前实体 ...

  6. python百度ai文字识别、不精确、进行处理_基于百度AI的文字识别-Python

    from aip import AipOcr是报错 识别图形验证码:from aip import AipOcr 解决方法: 下载baidu-aip这个库,可以直接使用pip下载:pip instal ...

  7. Android 图片文字识别DEMO(基于百度OCR)

    前言   OCR 是 Optical Character Recognition 的缩写,翻译为光学字符识别,指的是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,通过识别 ...

  8. python图片识别验证码软件_基于python图片识别工具(图片识别,车牌,PDF,验证码)...

    先上图  不多说. 对于一般的用户来说识别率还是能达到百分之90以上. 已经打包成exe文件.windows用户可以直接使用.要软件的加我QQ python代码: # -*- coding: UTF- ...

  9. 百度网盘 备份mysql数据库_利用百度云免费备份SQL数据库

    我们开发了一个会员管理系统,随着使用的人越来越多,异地备份数据库就显得十分重要,万一硬盘出问题了怎么办呢.所以就着手做这个工作. 首先呢,找到了几个专门用来提供备份数据库的网站,一年好几百,好贵.放弃 ...

最新文章

  1. 连锁商店 状态压缩dp(女赛)
  2. Scala集合:List修改及删除数据
  3. 02/03_Pytorch安装、Conda安装Pythorch,换源、pytorch官网、验证、安装jupyter、卸载、安装、启动jupyter、配置Jupyter notebook、使用
  4. C++学习之路 | PTA乙级—— 1020 月饼 (25分)(带注释)(精简)
  5. 语言程序设计第4版黄洪艺_谭浩强《C程序设计》第4版网授精讲班【教材精讲+考研真题串讲】视频网课讲义课程资料...
  6. 数学建模学习笔记(十一)——预测模型
  7. IE浏览器兼容性处理与提示
  8. ajax读取文本无响应,如何获得jQuery$.ajax错误响应文本?
  9. 反射类的构造函数和方法
  10. Go jsonrpc
  11. 利用matlab函数创建数组
  12. 标准偏差公式c语言,C语言 求标准偏差
  13. 物联网概念的理解,物联网核心要素是什么?
  14. 电脑重复文件扫描工具清理:Easy duplicate finder 5.10注册破解版
  15. 网络安全风险评估关键技术讨论
  16. 这次的深夜食堂来到了清迈,只为寻找那些…
  17. CSS(一):CSS概述、CSS引入方式、CSS优先级、CSS代码格式、CSS属性;CSS选择器;尺寸和颜色单位、背景和文本设置
  18. 浙里办H5微应用开发流程
  19. 面朝大海,爱上春暖花开
  20. tp-link wr 841n 300m 局域网限速的研究

热门文章

  1. 大厂常考机器学习面试题
  2. 多表联查(多表连接)(join)
  3. 微信小程序布局-图片+文字
  4. Debezium的MySQL连接器的工作原理
  5. 第八节 多元函数的极值及其求法
  6. 【内部类、匿名内部类、API】的学习
  7. 2018焦作ICPC E - Resistors in Parallel(规律+Java大数)
  8. 多线程的三种设计模式的介绍
  9. 标签语义化以及使用好处
  10. ant学习笔记—自定义Ant任务