什么是OCR

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

OCR也可简单地称为文字识别,是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,所以,OCR是一种非常快捷、省力的文字输入方式,也是在文字量比较大的今天,很受人们欢迎的一种输入方式。

总结起来就是一句话,将图像的文字转化成为字符。

OCR与Total Control脚本的联系

在 Total Control的设备控制接口中,我们提供了一些文字识别的接口,用户可以通过Total Control 提供的接口获取整个手机屏幕的文字,也可以获取手机屏幕上指定范围的文字。这样快捷的文字输入方式,会给用户带来很多方便。

在 Total Control的接口中,我们针对百度和Google 的OCR分别提供了文字识别接口。

• 百度ORC的四个接口:

loginBaiduCloud('API KEY', 'Secret Key'),

getTextByBaiduCloudOnAndroid(),

BDOcr.login(AppID, APIKey, SecretKey) ,

BDOcr.getText(filename, lang)

• Google OCR 的两个接口:

uploadTessData(fileName)

analyzeText(x1, y1, x2, y2, lang, mode)

百度OCR

百度OCR支持多场景下的文字检测识别,多项ICDAR指标世界第一,支持中、英、葡、法、德、意、西、俄、日、韩、中英混合识别,整体识别准确率高达90%以上,并提供高精度版,满足您更高的要求。

如何获取百度OCR账号

1. 注册百度云帐号并登录,链接为https://cloud.baidu.com/。

2. 在百度云中点击“产品服务”—>”人工智能”,进入文字识别链接为[https://console.bce.baidu.com/#/index/overview,如下图所示:

1. 进入下一页后点击创建应用,如下图所示

2. 在创建新应用的页面中,a)任意输入应用名称;b)应用类型选择“工具应用”;c)接口选择保持缺省。d)文字识别包名可以选择不需要,不过如果希望以后能够使用android版的文字识别,此处则要选择“需要”,Android后的输入栏内输入” com.sigma_rt.totalcontrol”。

如下图所示:

3. 点击立即创建,则可以获取自己的百度云OCR帐号,您能看到AppID,API Key,和Secret Key,这三个参数在对于后面的接口是必需的。如下图所示:

如何使用百度OCR接口

(一)获取手机屏幕上指定范围的文字

1. 申请自己的百度OCR帐号,获取API Key和Secret Key。详情请看【如何获取百度OCR账号】。

2. 用JS API “loginBaiduCloud”登陆百度OCR,例如:

var res = device.loginBaiduCloud('API KEY', 'Secret Key');

3. 利用设备接口“getTextByBaiduCloudOnAndroid”获取手机屏幕上的文字。例如:

res = device.getTextByBaiduCloudOnAndroid(11,366,701,716);

print("获取到的文字:\n"+res);

(二)获取指定图片上的文字

1. 申请自己的百度OCR帐号,获取AppID,API Key和Secret Key。详情请看【如何获取百度OCR账号】。

2. 用JS API “BDOcr.login”登陆百度OCR,例如:

BDOcr.login(AppID, APIKey, SecretKey)

3. 利用接口BDOcr.getText获取指定图片上的文字。例如:

var res=BDOcr.getText('E:\\Temp\\120\\1.jpg', 'CHN_ENG');

print(res);

BDOcr.getText的参数:

•filename:要解析图片的文件名

•lang:解析出来的语言标识,有如下选项:

CHN_ENG:中英文混合;

ENG:英文;

POR:葡萄牙语;

FRE:法语;

GER:德语;

ITA:意大利语;

SPA:西班牙语;

RUS:俄语;

JAP:日语;

百度OCR接口示例

(一)获取手机屏幕上的文字,手机屏幕如下图所示:

示例1:图中红色框表示屏幕坐标(11,366,701,716)

获取当前手机屏幕坐标(11,366,701,716)内的文字

//获取当前主控设备对象

var device = Device.getMain();

//登陆百度OCR,'API KEY', 'Secret Key'填入自己申请的账号密码

var res = device.loginBaiduCloud('API KEY', 'Secret Key');

if (res == false) {

print(lastError());

} else {

//获取当前手机屏幕坐标(11,366,701,716)内的文字

res = device.getTextByBaiduCloudOnAndroid(11,366,701,716);

print("获取到的文字:\n"+res);

}

示例2:

获取当前手机整个屏幕内的文字

//获取当前主控设备对象

var device = Device.getMain();

//登陆百度OCR,'API KEY', 'Secret Key'填入自己申请的账号密码

var res = device.loginBaiduCloud('API KEY', 'Secret Key');

if (res == false) {

print(lastError());

} else {

//获取当前手机整个屏幕内的文字

res = device.getTextByBaiduCloudOnAndroid();

print("获取到的文字:\n"+res);

}

运行结果

示例1:运行结果

Total control电脑控制手机手机群控系统

编程脚本自动化支持 REST AP/JS官网

Tota| Control手机控是一款用电脑控制手机的软件,可

自动化同步群控高达100台(可更多)手机。旗下TC

Games电脑控制手机玩游戏。提供手机投屏电脑

tc.sigma-rt.com.cn

示例2:运行结果

仅限紧急呼叫E忑AE因E

农令[14:12

Q Total Control

)e

网页资讯图片视频良医小说

查询英文相关结果: Total contro

Tota| Control电脑控制手机手机群控系统

编程脚本自动化支持 REST AP|/JS官网

Tota| Contro|手机控是一款用电脑控制手机的软件,可

自动化同步群控高达100台(可更多)手机。旗下TC

Games电脑控制手机玩游戏。提供手机投屏电脑

tc sigma-rt. com. cn

为您推荐

电脑控制安卓手机屏幕电脑控制手机软件电

电脑远程控制手机电脑操作手机电脑控制手

Total control手机控 Control手机控免费下

(二)获取指定图片上的文字,图片如下

//登陆百度OCR,‘AppID’,'API KEY', 'Secret Key'填入自己申请的账号密码

BDOcr.login('AppID', ' API KEY ', 'Secret Key');

//获取图片mypic.png内的文字

var res=BDOcr.getText('E:\\sigmaTC\\产品20180611\\ocr\\mypic.png', 'CHN_ENG');

print(res);

运行结果

杰华科枝

首页

Total Control

TC Games

智能投屏专家

手机/电脑/智电视(投影仪)/平板/车载电脑互投互控

万屏互联,多屏互动

设备控制接口之百度 OCR在Total Control的应用相关推荐

  1. UIPATH 调用第三方接口(百度OCR文字识别举例)

    业务场景: 使用RPA获取业务系统网站的验证码截图,将截图转base64之后传到百度OCR文字识别接口,获取文字识别结果,将识别结果用作登陆业务系统的验证码凭证.从而解决RPA自动登录系统的问题. 设 ...

  2. 免费的图片识别接口,百度ocr的SDK使用java版

    申请使用,个人完成认证可获得一定的免费使用场景,用来测试或者简单的场景足够了 百度智能云-登录https://console.bce.baidu.com/ai/?_=1649487753967& ...

  3. python调用百度接口实现ocr识别_Python调用百度OCR实现图片文字识别的示例代码

    百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '* ...

  4. Java调用百度OCR文字识别的接口

    调用百度OCR文字识别的接口,来自于百度官网,亲测可以使用 跳转链接 FileUtil的下载链接 Base64Util下载链接 HttpUtil下载链接 GsonUtils下载链接 Accurate. ...

  5. 基于SpringBoot调用百度ocr以及企查查接口实现对营业执照信息的提取并识别真伪

    基于SpringBoot调用百度ocr以及企查查接口实现对营业执照信息的提取并识别真伪 1.application.yml 2.Controller层接口 3.相关工具类 3.1 DateUtils ...

  6. 百度文字识别 百度OCR接口申请

    1.百度文字识别 百度OCR 的接口申请 https://blog.csdn.net/biao197/article/details/102907492

  7. python 通过调取百度接口进行图片OCR文字识别 高识别率

    一.客户需要一个判断工作证姓名和输入的姓名是否一致的需求,用Tesseract 试了下 发现识别率太低 ,只能另寻方法 ,想起百度的api接口, 1,需要先在百度https://login.bce.b ...

  8. 调用百度OCR接口识别身份证 微信小程序

    申请百度AI账号获取百度OCR接口API Key和Secret Key 申请地址: http://ai.baidu.com/?track=cp:aipinzhuan|pf:pc|pp:AIpingta ...

  9. 火山PC使用百度OCR接口识别文字

    本源码转载自利快云https://www.lkuaiy.com/ 火山PC使用百度OCR接口识别文字 一.需要调用的模块 视窗基本类 MFC界面基本类 火山模块 二.百度OCR使用前准备 百度OCR是 ...

  10. python利用百度云接口实现文字OCR功能

    python利用百度云接口实现文字OCR功能 1. 前言 在日常生活中有时我们需要从图片中获取文字,虽然QQ上面已经有了相关的功能,但是出于学习的目的,我打算利用百度智能云的文字OCR接口来实现OCR ...

最新文章

  1. 单链表-单链表拆分为两个线性表(尾插法+尾插法)
  2. spring boot logback配置
  3. python监控单台多实例数据库服务器的数据库端口
  4. 文献记录(part69)--公平性机器学习中基于分类间隔的歧视样本发现和消除算法
  5. 你见过的MCU最高GPIO翻转频率是多少?
  6. C语言一维数组实现杨辉三角,一维数组实现杨辉三角
  7. OC中数组的遍历方法
  8. iOS中常用的颜色色值
  9. 无法删除文件,无法读源文件或磁盘
  10. Android内存优化深入解析
  11. 关闭bitLocker驱动器加密
  12. MySQL 查询学生的总成绩并进行排名_MySQL查询各科成绩前三名的记录及排名(不考虑成绩并列情况)...
  13. matlab 表示希腊字母yita,常用希腊字母读法
  14. 转换罗马数字,输入一串数字字符串,将其转化为希腊字符串。
  15. 老嘤学习笔记——python函数
  16. 破窗效应(Break Pane Law)
  17. 编译内核发现wireless_send_event未定义错误
  18. 2022年全球市场通信专用逻辑IC总体规模、主要生产商、主要地区、产品和应用细分研究报告
  19. 2022年5月28日软考高项四川总结
  20. 袁国宝:续航1000公里,特斯拉跟不跟?

热门文章

  1. 复制xml导致乱码问题解决。
  2. 最小二乘法计算平面度
  3. 如何一个月左右拿下PAT甲级(浙大机试)满分
  4. 计算机的应用主要遍布于,【应用】激光雕刻在各行业的应用
  5. Unity粒子特效系列-毒液喷射预制体做好了,unitypackage包直接用
  6. 酷狗缓存文件kgtemp解密
  7. 【每日一具9】Gif动画录制工具
  8. ubuntu下载字体
  9. jquery控制下的video视频播放
  10. 光储直柔配电系统浅析