selenium+opencv干掉滑动验证码
我们在用自动化测试来做爬虫的时候,总是会遇见很多的验证码,其中的滑块拼接验证就是其中一种;selenium是一个自动化测试库,opencv是计算机视觉库,我们可以用这两个库来模仿人工滑动验证码,完成验证码验证操作!
文章目录
- 操作流程:
- 1、找到目标
- 2、下载验证码图片
- 3、识别图像戳口
- 3.1、读取本地图片并展示
- 3.2、图片灰度处理
- 3.3、去掉滑块黑色部分
- 3.4、识别图像位置
- 4、拖动滑块
- 4.1、控制滑块滑动
- 4.2、验证是否滑动成功
- 代码汇总:
目标网站: http://dun.163.com/trial/sense
完成对象:
操作流程:
1、找到目标
- 这里我们需要使用
selenium
库来模拟操作浏览器,可以通过pip install selenium
安装它,同时需要下载对应浏览器版本的webdriver
来辅助控制电脑,这里就不详细讲解了,直接看操作流程:
from selenium import webdriver
import time#创建浏览器
driver = webdriver.Chrome()#输入网址,打开该网站
driver.get('http://dun.163.com/trial/sense')#点击网页
#1、点击选择“可疑用户-滑动拼图”
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/ul/li[2]').click()
time.sleep(1)#等待加载
#2、点击验证码位置“请完成安全验证”
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[1]/span').click()
- 通过上面的流程找到验证码的位置,开始获取验证码图片
2、下载验证码图片
- 从网页中,我们可以看出这是两张图片:
- 现在需要把这两张图片下载到本地文件
#获取到两张图片链接bg_img_scr = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[1]').get_attribute('src')front_img_src = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[2]').get_attribute('src')#把图片下载到本地with open('./bg.jpg',mode='wb') as f:f.write(requests.get(bg_img_scr).content)f.close()with open('./front.jpg',mode='wb') as f:f.write(requests.get(front_img_src).content)f.close()
3、识别图像戳口
3.1、读取本地图片并展示
- 这里包含三个部分,分别为:读取,展示,释放,缺一不可。
import cv2
#读取图片
bg = cv2.imread('./bg.jpg')
front = cv2.imread('./front.jpg')#展示图片
cv2.imshow('gray1',bg)#gray1,gray2是窗口名称
cv2.imshow('gray2',front)#释放资源
cv2.waitKey(0)#按任意键退出图片展示
cv2.destroyAllWindows()
展示结果:
3.2、图片灰度处理
- 图片灰度处理的目的是让颜色方差更明显
#灰度处理
bg = cv2.cvtColor(bg,cv2.COLOR_BGR2GRAY)
front = cv2.cvtColor(front,cv2.COLOR_BGR2GRAY)
3.3、去掉滑块黑色部分
- 目的是为了和背景图片进行匹配
front = front[front.any(1)]#0表示黑色,1表示高亮部分
3.4、识别图像位置
- 通过这个算法,图像从左上角开始匹配,进行像素点对比,并记录每个像素点的数值,以多维数组的方式返回
- 通过numpy将数组变为一维数组,索引出最大值的位置。
import numpy as np
#匹配->cv图像匹配算法
result = cv2.matchTemplate(bg, front, cv2.TM_CCOEFF_NORMED)#match匹配,Template模板;精度高,速度慢的方法
index_max = np.argmax(result)#返回的是一维的位置,最大值索引
- 根据一维数组的位置反推出二维数组中的位置。
#反着推最大值的二维位置,和opencv是相反的
x, y = np.unravel_index(index_max, result.shape)
print ("二维中坐标的位置:",x, y)
二维中坐标的位置: 79 145
- 这个位置就是戳口的位置
注意: opencv的坐标与坐标轴的是相反的。
4、拖动滑块
4.1、控制滑块滑动
from selenium.webdriver.common.action_chains import ActionChains
drop = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[2]/div[2]')
ActionChains(driver).drag_and_drop_by_offset(drop, xoffset=y, yoffset=0).perform()
4.2、验证是否滑动成功
- 当验证通过后,滑动底的部会出现“验证成功”,如图:
- 可以通过检查这个文字判断是否验证成功,如果第一次验证失败,可以继续验证,直到成功为止!
success = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[2]/span[2]').textif success == '验证成功': breakelse:print ('第%s次验证失败...'%k,'\n')
代码汇总:
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time,requests
import cv2
import numpy as np#创建浏览器
driver = webdriver.Chrome()#输入网址,打开该网站
driver.get('http://dun.163.com/trial/sense')#点击网页
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/ul/li[2]').click()
time.sleep(1)
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[1]/span').click()
time.sleep(1)k = 1
while True:#获取到两张图片链接bg_img_scr = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[1]').get_attribute('src')front_img_src = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[2]').get_attribute('src')#把图片下载到本地with open('./bg.jpg',mode='wb') as f:f.write(requests.get(bg_img_scr).content)f.close()with open('./front.jpg',mode='wb') as f:f.write(requests.get(front_img_src).content)f.close()#读取图片bg = cv2.imread('./bg.jpg')front = cv2.imread('./front.jpg')#灰度处理bg = cv2.cvtColor(bg,cv2.COLOR_BGR2GRAY)front = cv2.cvtColor(front,cv2.COLOR_BGR2GRAY)#去掉滑块黑色部分front = front[front.any(1)]#0表示黑色,1表示高亮部分#匹配->cv图像匹配算法result = cv2.matchTemplate(bg, front, cv2.TM_CCOEFF_NORMED)#match匹配,Template模板;精度高,速度慢的方法index_max = np.argmax(result)#返回的是一维的位置,最大值索引#反着推最大值的二维位置,和opencv是相反的x, y = np.unravel_index(index_max, result.shape)print ("二维中坐标的位置:",x, y)print ("正在进行第%s次滑动验证"%k)drop = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[2]/div[2]') ActionChains(driver).drag_and_drop_by_offset(drop, xoffset=y, yoffset=0).perform()time.sleep(1)#验证成功后获取“验证成功”,直到找到“验证成功”才跳出while True循环success = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[2]/span[2]').textif success == '验证成功': breakelse:print ('第%s次验证失败...'%k,'\n')k = k + 1
print ('已经通过验证码!!!')
运行结果:
二维中坐标的位置: 50 258
正在进行第1次滑动验证
第1次验证失败... 二维中坐标的位置: 79 145
正在进行第2次滑动验证
已经通过验证码!!!
selenium+opencv干掉滑动验证码相关推荐
- python+selenium+chrome 做滑动验证码 会被浏览器检测到使用的自动软件导致滑动验证失败
python+selenium+chrome 做滑动验证码 会被浏览器检测到使用的自动软件导致滑动验证失败 解决方法:代码中添加: import time from selenium import w ...
- selenium爬虫|破解滑动验证码以极验为例
爬虫访问一些网站遇到滑动验证码解决方案 这里是用selenium做模拟,如果是requests可以封装这个登录方法来获取登录后的cookies也是可以用的. 1 思路 先讲思路,分析流程 我们输入账号 ...
- selenium篇之滑动验证码
一.介绍 现在出现了一种通过用户鼠标移动滑块来填补有缺口图片的验证码,我们叫做滑动验证码.它的原理很简单,首先生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以 ...
- 基于nodejs+selenium自动过滑动验证码的QQ刷赞
引子 不知道大家是否还记得之前让我刷赞的小朋友,自从他回到学校后,可能是由于学业太忙,把我们组成刷赞团队的事情忘记了,只是每天早上给我发信息帮他刷赞,迟迟没有新的用户,刷赞就没有量产的动力,我怠慢了几 ...
- selenium破解bilbili滑动验证码
登陆b站的时候大家都会见到滑动验证码,打开开发者工具分析一下这里的验证码 1:首先需要鼠标触碰到滑动按钮才会显示出完整的验证码图片 2:点击按钮出现缺口图片 3:查看图片元素会(打开图片链接)发现完整 ...
- selenium登录 京东滑动验证码
京东的滑动验证码在页面上是没有原图的,所有我是用ps把他们拼成一个的. from selenium import webdriver from selenium.webdriver import Ac ...
- selenium自动化案例(二)滑动验证码破解
文章目录 写在前面 大致思路 Python实现 几个小坑 写在前面 最近学习了滑动验证的一个破解思路,是利用OpenCV的图形匹配算法进行对比验证,从而推算出滑块移动的距离,在实际应用中比较常见,我主 ...
- BiliBili等网站极验滑动验证码的详细破解过程
基于selenium自动化的滑动验证码破解 selenium python 验证码 1.环境配置(Linux) python2.7 pip安装的库:selenium , PIL Chrome浏览器 , ...
- 使用java + selenium + OpenCV破解网易易盾滑动验证码
使用java + selenium + OpenCV破解网易易盾滑动验证码 网易易盾:dun.163.com * 验证码地址:https://dun.163.com/trial/jigsaw * 使用 ...
最新文章
- 70.nodejs操作mongodb
- angular select设置默认选中_改进 Angular + Jest 项目中组件测试的调试
- R语言使用GGally包的ggpairs函数可视化变量相关性分析图:包含散点图、密度图、柱状图、箱图等、并自定义数据点的大小
- torch.nn.functional.pad
- java round number,Java Number Math 类
- 使用SVD求取矩阵的伪逆
- dns tunnel CC
- 学编程又一火爆网站:哔哩哔哩
- java poi之Excel的读取
- 清华大学朱旭峰:中国智库大数据报告2017预发布
- MyBatis框架 注解
- 程序员入职 6 天即被开除:项目丢了,新人背锅?
- 离线版MSDN下载地址
- 在虚拟机上搭建中标麒麟Neokylin6桌面版开发环境
- windows 强制关闭程序并强制删除文件
- 木马万能查杀清除方法,木马专杀
- emv交易流程介绍,简易波动指标EMV基础知识介绍:EMV的计算公式_EMV应用法则
- Linux 字体管理相关
- 教你Zbrush 4R7增强光滑笔刷强度方法
- Java实现统计字符次数(按大写、小写、数字来统计)
热门文章
- spark filter 堆栈溢出
- ssh汉字乱码怎么办_SSH 中文乱码解决
- 以太坊私链搭建(二)——genesis.json字段解读
- Capture One Pro 12常用技巧(二)
- 计算机开机先检测什么问题,电脑按下开机键后 没反应 但检测电源却没有問題,是什么情况?...
- 系统重装之后查看否激活成功
- UIToolbar背景透明设置
- 睡眠即醒 蓝牙_众人皆睡你独醒?Bose遮噪睡眠耳塞用黑科技助你酣睡!
- hadoop HA 常见错误
- vscode设置快捷键删除行