艺赛旗RPA离线识别普通验证码
前言
以下方法适用于简易的验证码识别,需要根据自身情况进行调整。
一、配置环境
安装pytesseract库
首先我们需要检查是否已经安装了pytesseract库,经过检查8.0以上版本的设计器,都是已内置了pytesseract库的,所以可以不用再安装。
想练练手也可以再重新安装一遍。
安装:cd 至Python\Scripts,运行命令pip3 install pytesseract
安装失败可参考:【 https://support.i-search.com.cn/article/1594016938814】安装Tesseract-OCR
我这里使用的是4.1版本(64位):tesseractocrw64setupv41020190314.exe
另外提供32位的安装包:tesseractocrw32setupv400beta120180414.exe
也可自行去官网下载所需版本:https://digi.bib.uni-mannheim.de/tesseract/
记住使用对应位数的安装包进行安装,安装时全部next即可。找到pytesseract.py配置tesseract_cmd
(1)我使用的是8.0版本的设计器,pytesseract.py的路径如图,一般是在Python\Lib\site-packages\pytesseract下:
(2)打开pytesseract.py配置tesseract_cmd,配置路径为第二步安装的Tesseract-OCR下的tesseract.exe的路径,默认路径为C:\Program Files\Tesseract-OCR\tesseract.exe,根据自身安装情况进行配置,记住路径前加r,防止字符转义。
二、对图片进行处理
- 1.保存验证码图片,对图片进行二值化处理
我们对验证码图片进行截图保存,注意截图的位置需要自己进行调整,根据自身情况调整为最佳位置。
from PIL import Image
#选择需要处理的验证码截图
img = Image.open('yzm.jpg')
#模式L”为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。
Img = img.convert('L')
#自定义灰度界限,大于这个值为黑色,小于这个值为白色。threshold可根据实际情况进行调整。
threshold = 135
table = []
for i in range(256): if i < threshold: table.append(0) else:table.append(1)
#图片二值化
photo = Img.point(table,'1')
#保存处理好的图片
photo.save('yzm.jpg')
处理后的图片如下:
三、识别验证码
import pytesseract
from PIL import Image
#路径前加r防止转义
path = r'C:\yzm.jpg'
img = Image.open(path)
yzm= pytesseract.image_to_string(img)
print(yzm)
四、总结
我在第二值化处理之后发现处理后的图片几乎没有噪点,所以我这里并没有对图片进行降噪,便可直接进行识别。
如果图片噪点比较多是要对图片进行降噪再识别,可以自己在网上搜索降噪的代码。
大家要根据自身情况对图片进行处理。
艺赛旗RPA离线识别普通验证码相关推荐
- 艺赛旗RPA验证码处理系列(一):解决滑动加文字识别验证码
目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 有同学在项目上碰到这 ...
- 艺赛旗RPA验证码处理系列(三):破解极验滑动验证码
目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 一,介绍 一些网站会 ...
- iS-RPA2022.1.0 | 艺赛旗RPA新版本正式发布
了解RPA: www.i-search.com.cn 学习RPA https://support.i-search.com.cn/ 更智能的操作方式,更高效的升级体验,更生动的交互方式,更快捷的运行速 ...
- RPA学习天地:艺赛旗RPA机器人的4种类型和区别介绍
RPA学习天地为大家整理了RPA培训视频,欢迎关注,同步获取最新完整资料请关注 目前艺赛旗的有人值守机器人(助手机器人)和无人值守机器人都是需要先在控制台进行创建和配置账号才能使用,用户必须登录机器人 ...
- 艺赛旗RPA 网页处理系列(一):在网页中的可变元素如何准确定位
目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 在网页中的可变元素如 ...
- 艺赛旗RPA开发金蝶ERP自动化流程的技巧
前言 最近在开发金蝶EAS(ERP)系统的自动化流程,使用的艺赛旗版本为20.5,以下是多日来对金蝶系统的开发经验总结,希望对各位有用. 一.注入Java插件方法 安装了设计器20.5的版本后发现无法 ...
- 艺赛旗RPA 第三方库系列(一):如何调用 Python 第三方库
目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 当你需要调用使用 p ...
- 艺赛旗RPA 网页处理系列(三):网页检查 / 审查小技巧
目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 当需要进行网页操作的 ...
- 艺赛旗RPA 网页处理系列(四):网页表格中获取数据,并点击相应记录后的按钮操作说明总结
目前艺赛旗RPA已经更新到8.0版本,可以让所有用户免费下载试用http://www.i-search.com.cn/index.html?from=line1 (复制链接下载) 问题描述 最近有很多 ...
最新文章
- c语言程序设计试题及答案十,C语言程序设计试题试题及答案.doc
- 攻和防谁更厉害?AI技术在恶意软件检测中的应用和对抗
- oracle中常见ck和fk是什么,Oracle常用知识总结
- 3月30日作业:采购管理、信息管理和配置管理
- sap 供应商表_财务人员学习SAP的路线图
- 如何在 Mac 上将 JPG图像合并为一个PDF
- Docker基础入门总结
- 大牛出招|分分钟解决 MySQL 查询速度慢与性能差
- Spark Job Scheduling
- java eight,Java语法基础学习DayEight
- linux java 选择题_java面试题:Linux
- 深入浅出设计模式python_Head First Python(第2版) 中文版 高清pdf扫描版[161MB]
- linux系统时间与网络时间不同步
- 百度快照投诉技巧案例分析百度快照就是这样刷出来的
- Hibernate入门简介----张冬
- Holy Grail————计蒜客
- python上市公司有哪些_python调用tushare获取A股上市公司基础信息
- 一级下拉对应多个二级下拉联动
- springboot使用ResourceUtils.getFile读取不到文件
- Rasa 3.x 学习系列-Rasa [3.4.1] - 2023-01-19新版本发布