按键精灵通过实践,也可以接入百度的OCR,百度OCR免费额度为,每日50000次普通调用,对于日常应用已经足够,返回识别内容时间在1s以内(免费版有一秒内请求次数限制,不充钱也无法达到更短的时间)。百度OCR的优势是,相比找图识字,OCR可以无视文字背景,以及文字的字体,颜色,粗细,角度进行文字识别,更加省心。

第一步:申请百度OCR服务

这一步非常简单,进入 百度智能云-登录 ,登入百度账号后,在产品应用里面选择文字识别服务

进入后,选择创建应用,相关参数选择默认的即可,最后会得到自己的APIKey 和SecretKey,这两个参数十分重要,把它们复制下来保存起来。

重要:有了这两个key,就可以尝试请求百度,然后看返回access token是否成功,如果不成功,那就是key有问题。具体请求方法,百度的页面有各种教程,对应各种编程语言和环境。

第二步 在按键精灵中使用百度OCR

首先下载封装好的百度OCR命令库:点击下载,

把BaiduOCR.qml放到按键精灵安装文件夹下面的lib文件夹里头,路径为:

C:\Program Files (x86)\按键精灵\按键精灵2014\lib

在按键精灵菜单,“我的命令库”中能够找到一个叫做BaiduOCR的自定义库,这个函数需要6个参数,分别是APIKey和SecretKey的值,以及需要识别屏幕矩形区域左上点和右下点的四个坐标值:(APIKey,SecretKey,x1,x2,y1,y2),调用这个自定义库会返回一个识别文本结果。

※使用时,不要让其他东西把识别区域遮住

具体调用方法:

APIKey = "填写自己的"  ’加在引号里头,别丢了引号
SecretKey= "填写自己的"’在脚本开始就指定好APIKey和SecretKey的值,后面只需要填写需要识别区域的坐标值即可。test = Lib.baiduOCR.Words(APIKey,SecretKey,56,0,209,39)TracePrint "识别结果为:"& test

这次识别的目标是以下游戏画面的指定部分(红框),选择背景和文字颜色接近的部分,测试下百度OCR的准确度,使用按键精灵自带的“抓抓” 工具的“选择区域”去获取坐标(蓝框):

将获取到的坐标(x1,x2,y1,y2)填好,点击调试,结果为:

以上文字被轻松识别。

在一个脚本中,我们可以多次调用文字识别不同区域,并得到不同的识别结果,之后可以用识别结果对一个或多个变量进行赋值,比如针对一个游戏画面,将角色名字识别到之后赋值给变量name,识别到技能名称后赋值给变量skill。之后,可以根据赋值的结果进行其他操作。

视频教程

充分进行了视频演示。

B站地址:按键精灵+百度文字识别OCR使用教程_哔哩哔哩_bilibili

示例1,根据识别的结果反馈不同的按键操作

selectMenu=Lib.baiduOCR.words(APIKey,SecretKey,1509, 268, 1613, 323) ’指定选择菜单作为识别区域If selectMenu = "是" Then  ’识别选择菜单是否出现“是”,如果出现就按下L,没出现就按KDelay 1000KeyPress "L", 1ElseIfKeyPress "K", 1End If’用条件语句判断识别结果的最后一个字是不是符合要求,符合就操作
stage1_title = Lib.baiduOCR.words(APIKey,SecretKey,1462,419,1728,486)s1 = right(stage1_title,1) ’取出识别结果的最右边(即最后)一个字If s1 = "納" or s1="場" or s1="島" or s1="地" Then Delay 500KeyPress "L", 1Delay 3000KeyPress "K", 1End if

注意:

本命令库函数可以识别多行内容,但是最终赋值只会保留最下面一行的结果,请在使用时最好只针对一行文字进行识别。如果要保存所有内容,请善用按键精灵的写入文本功能。

多行识别示例:

words = Lib.baiduOCR.Words(APIKey,SecretKey, 323,375,528,478)
TracePrint words

识别下图右下角的多行文字(百度OCR可以识别简繁体,英文):

调试结果:

可以看出变量word的值是最新的那一行字。

在百度的后台,能够看到当天调用的次数,以及查询历史调用次数,可以随时查询是否超过每日限制。

按键精灵使用百度文字识别(百度ocr)教程相关推荐

  1. 百度文字识别 百度OCR接口申请

    1.百度文字识别 百度OCR 的接口申请 https://blog.csdn.net/biao197/article/details/102907492

  2. ios 百度ocr_Android与iOS原生百度文字识别(OCR)插件,可以使用官网API参数

    更新记录 1.0.0(2020-11-09) 初始版本特点 统一的返回结构 Android 与 IOS 乃至服务端使用API的返回体是一致的 可以按官方文档设置参数,来实现差异需求 比如,想要返回的识 ...

  3. 百度文字识别(OCR)服务-傻瓜式

    1.注册百度账号 进入百度开发者中心-百度智能云,直接按图操作,领取免费资源.创建应用.少说话,开撸 百度开发者中心-汇聚.开放.助力.共赢百度开发者中心是一个面向开发者的知识分享平台,专注于为开发者 ...

  4. 百度文字识别接口申请教程

    1. 打开 百度ai开放平台 点击控制台 2. 产品服务 -> 文字识别 3. 免费领取 4.选择通用文字识别(标准版) 5. 创建应用 6. 应用归属选择个人,其他按要求填写 6. 选择我的应 ...

  5. python 百度ocr安装_Python利用百度文字识别(OCR)服务实现图片文字提取,准确率超高...

    最近和朋友聊天,聊到一个充满使命感但又略显心酸的话题--下班回家在网上给小朋友抄题...那么问题来了,除了大家所知的QQ文字识别功能之外,还有哪些方式可以做到文字识别呢. 作为一名热心的Python小 ...

  6. 按键精灵 百度文字识别(百度ocr)OCRSpace文字识别

    目录 1. 申请百度OCR服务 1.1. 百度OCR登录 1.2 创建新应用 1.3 免费领取次数 1.3 查看是否创建成功 2. 按键精灵运用百度OCR接口 2.1 通用文字识别(高精度版)文档 2 ...

  7. Android 集成百度文字识别OCR身份证银行卡驾驶证识别

    SDK提供了下列百度AI开放平台RESTful接口的封装.文字识别的服务,可实现一些通用文字,网络图片文字,身份证,银行卡,驾驶证,行驶证,车牌,营业执照,通用票据等的识别需求,简化输入操作. 本篇主 ...

  8. 百度文字识别官方Demo

    百度OCR 官方Demo 百度文字识别官网 OCR Android SDK 开发者文档 百度sdk下载 OCR: Optical Character Recognition 光学字符识别 一. 管理控 ...

  9. 申请百度文字识别APIkey和Secret Key+文字验证码识别案例

    1.首先打开百度文字识别官网,输入百度账号登陆 2.找到文字识别,然后进入后点击创建应用 3.应用名称,随便填写一个即可 文件识别包名选择 不需要即可,描述随便填一些 4.点击立即创建,出现如下图,点 ...

最新文章

  1. 好的高等教育 赫胥黎
  2. 用计算机才能奏乐曲,计算机音乐系统和音乐听觉训练
  3. Failed to install Tomcat7 service 解决
  4. android伸缩动画自定义,Android干货:自定义带动画的View
  5. Oracle SQL Developer 调试存储过程步骤(Oracle)
  6. linux lvs 存储层,LVS集群配置之LVS介绍
  7. html中图片阴影怎么写,css如何给图片加阴影?
  8. eclipse中jsp页面%@page import=javax.servlet.http.*%报错
  9. tp交换机管理页面_TP-LINK交换机设置细节
  10. python3 利用Instaloader下载instagram数据示例
  11. 平板电脑黑苹果EFI_首次安装黑苹果系统,原来如此简单,比真正的Mac电脑更快...
  12. 单相PWM整流器工作原理与调制方向判断
  13. 1024 程序员节|用代码,改变世界
  14. CPU 的 ring0,ring1,ring2,ring3
  15. 教师节感恩_在Excel中计算感恩节日期
  16. python函数名前带个杠
  17. 智能车竞赛技术报告 | 节能信标组 - 兰州交通大学 - 先锋队
  18. send 命令 linux,linux的send命令
  19. 计算机模拟实验的关系,试说明数值模拟方法的特点,它与理论研究,实验研究有什么关系...
  20. 头歌平台(EduCoder)—— Matplotlib接口和常用图形

热门文章

  1. 2009年我国报刊发行创新的五个关键词
  2. arduino 328P的BootLoader
  3. 手机android app 无线控制led灯开关
  4. 大数据下的用户与价值分析
  5. 如何拍背景虚化的照片_如何拍摄出突出主体(背景虚化)的照片
  6. mysql和vba哪里自学_自学 VBA 到中等水平一般需要多久?
  7. matlab频谱分析中振幅的物理意义,对速度信号进行傅里叶谱分析之后,其纵坐标对应的幅值的物理意义是什么?是速度,还是振幅...
  8. ArcGIS已知经纬度范围裁剪图像的步骤
  9. 央企招聘:中国航空工业集团直属公司2023秋季招聘
  10. Geek 设计师们疯狂的桌面