我们在用自动化测试来做爬虫的时候，总是会遇见很多的验证码，其中的滑块拼接验证就是其中一种；selenium是一个自动化测试库，opencv是计算机视觉库，我们可以用这两个库来模仿人工滑动验证码，完成验证码验证操作！

文章目录

操作流程：
- 1、找到目标
- 2、下载验证码图片
- 3、识别图像戳口
- - 3.1、读取本地图片并展示
  - 3.2、图片灰度处理
  - 3.3、去掉滑块黑色部分
  - 3.4、识别图像位置
- 4、拖动滑块
- - 4.1、控制滑块滑动
  - 4.2、验证是否滑动成功
代码汇总：

目标网站： http://dun.163.com/trial/sense
完成对象：

操作流程：

1、找到目标

这里我们需要使用selenium库来模拟操作浏览器，可以通过pip install selenium安装它，同时需要下载对应浏览器版本的webdriver来辅助控制电脑，这里就不详细讲解了，直接看操作流程：

from selenium import webdriver
import time#创建浏览器
driver = webdriver.Chrome()#输入网址，打开该网站
driver.get('http://dun.163.com/trial/sense')#点击网页
#1、点击选择“可疑用户-滑动拼图”
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/ul/li[2]').click()
time.sleep(1)#等待加载
#2、点击验证码位置“请完成安全验证”
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[1]/span').click()

通过上面的流程找到验证码的位置，开始获取验证码图片

2、下载验证码图片

从网页中，我们可以看出这是两张图片：
现在需要把这两张图片下载到本地文件

    #获取到两张图片链接bg_img_scr = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[1]').get_attribute('src')front_img_src = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[2]').get_attribute('src')#把图片下载到本地with open('./bg.jpg',mode='wb') as f:f.write(requests.get(bg_img_scr).content)f.close()with open('./front.jpg',mode='wb') as f:f.write(requests.get(front_img_src).content)f.close()

3、识别图像戳口

3.1、读取本地图片并展示

这里包含三个部分，分别为：读取，展示，释放，缺一不可。

import cv2
#读取图片
bg = cv2.imread('./bg.jpg')
front = cv2.imread('./front.jpg')#展示图片
cv2.imshow('gray1',bg)#gray1，gray2是窗口名称
cv2.imshow('gray2',front)#释放资源
cv2.waitKey(0)#按任意键退出图片展示
cv2.destroyAllWindows()

展示结果：

3.2、图片灰度处理

图片灰度处理的目的是让颜色方差更明显

#灰度处理
bg = cv2.cvtColor(bg,cv2.COLOR_BGR2GRAY)
front = cv2.cvtColor(front,cv2.COLOR_BGR2GRAY)

3.3、去掉滑块黑色部分

目的是为了和背景图片进行匹配

front = front[front.any(1)]#0表示黑色，1表示高亮部分

3.4、识别图像位置

通过这个算法，图像从左上角开始匹配，进行像素点对比，并记录每个像素点的数值，以多维数组的方式返回
通过numpy将数组变为一维数组，索引出最大值的位置。

import numpy as np
#匹配->cv图像匹配算法
result = cv2.matchTemplate(bg, front, cv2.TM_CCOEFF_NORMED)#match匹配,Template模板;精度高，速度慢的方法
index_max = np.argmax(result)#返回的是一维的位置，最大值索引

根据一维数组的位置反推出二维数组中的位置。

#反着推最大值的二维位置，和opencv是相反的
x, y = np.unravel_index(index_max, result.shape)
print ("二维中坐标的位置：",x, y)

二维中坐标的位置： 79 145

这个位置就是戳口的位置

注意： opencv的坐标与坐标轴的是相反的。

4、拖动滑块

4.1、控制滑块滑动

from selenium.webdriver.common.action_chains import ActionChains
drop = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[2]/div[2]')
ActionChains(driver).drag_and_drop_by_offset(drop, xoffset=y, yoffset=0).perform()

4.2、验证是否滑动成功

当验证通过后，滑动底的部会出现“验证成功”，如图：
可以通过检查这个文字判断是否验证成功，如果第一次验证失败，可以继续验证，直到成功为止！

    success = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[2]/span[2]').textif success == '验证成功':            breakelse:print ('第%s次验证失败...'%k,'\n')

代码汇总：

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time,requests
import cv2
import numpy as np#创建浏览器
driver = webdriver.Chrome()#输入网址，打开该网站
driver.get('http://dun.163.com/trial/sense')#点击网页
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/ul/li[2]').click()
time.sleep(1)
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[1]/span').click()
time.sleep(1)k = 1
while True:#获取到两张图片链接bg_img_scr = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[1]').get_attribute('src')front_img_src = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[2]').get_attribute('src')#把图片下载到本地with open('./bg.jpg',mode='wb') as f:f.write(requests.get(bg_img_scr).content)f.close()with open('./front.jpg',mode='wb') as f:f.write(requests.get(front_img_src).content)f.close()#读取图片bg = cv2.imread('./bg.jpg')front = cv2.imread('./front.jpg')#灰度处理bg = cv2.cvtColor(bg,cv2.COLOR_BGR2GRAY)front = cv2.cvtColor(front,cv2.COLOR_BGR2GRAY)#去掉滑块黑色部分front = front[front.any(1)]#0表示黑色，1表示高亮部分#匹配->cv图像匹配算法result = cv2.matchTemplate(bg, front, cv2.TM_CCOEFF_NORMED)#match匹配,Template模板;精度高，速度慢的方法index_max = np.argmax(result)#返回的是一维的位置，最大值索引#反着推最大值的二维位置，和opencv是相反的x, y = np.unravel_index(index_max, result.shape)print ("二维中坐标的位置：",x, y)print ("正在进行第%s次滑动验证"%k)drop = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[2]/div[2]')    ActionChains(driver).drag_and_drop_by_offset(drop, xoffset=y, yoffset=0).perform()time.sleep(1)#验证成功后获取“验证成功”，直到找到“验证成功”才跳出while True循环success = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[2]/span[2]').textif success == '验证成功':            breakelse:print ('第%s次验证失败...'%k,'\n')k = k + 1
print ('已经通过验证码!!!')

运行结果：

二维中坐标的位置： 50 258
正在进行第1次滑动验证
第1次验证失败... 二维中坐标的位置： 79 145
正在进行第2次滑动验证
已经通过验证码!!!

selenium+opencv干掉滑动验证码相关推荐

python+selenium+chrome 做滑动验证码会被浏览器检测到使用的自动软件导致滑动验证失败
python+selenium+chrome 做滑动验证码会被浏览器检测到使用的自动软件导致滑动验证失败解决方法:代码中添加: import time from selenium import w ...
selenium爬虫|破解滑动验证码以极验为例
爬虫访问一些网站遇到滑动验证码解决方案这里是用selenium做模拟,如果是requests可以封装这个登录方法来获取登录后的cookies也是可以用的. 1 思路先讲思路,分析流程我们输入账号 ...
selenium篇之滑动验证码
一.介绍现在出现了一种通过用户鼠标移动滑块来填补有缺口图片的验证码,我们叫做滑动验证码.它的原理很简单,首先生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以 ...
基于nodejs+selenium自动过滑动验证码的QQ刷赞
引子不知道大家是否还记得之前让我刷赞的小朋友,自从他回到学校后,可能是由于学业太忙,把我们组成刷赞团队的事情忘记了,只是每天早上给我发信息帮他刷赞,迟迟没有新的用户,刷赞就没有量产的动力,我怠慢了几 ...
selenium破解bilbili滑动验证码
登陆b站的时候大家都会见到滑动验证码,打开开发者工具分析一下这里的验证码 1:首先需要鼠标触碰到滑动按钮才会显示出完整的验证码图片 2:点击按钮出现缺口图片 3:查看图片元素会(打开图片链接)发现完整 ...
selenium登录京东滑动验证码
京东的滑动验证码在页面上是没有原图的,所有我是用ps把他们拼成一个的. from selenium import webdriver from selenium.webdriver import Ac ...
selenium自动化案例（二）滑动验证码破解
文章目录写在前面大致思路 Python实现几个小坑写在前面最近学习了滑动验证的一个破解思路,是利用OpenCV的图形匹配算法进行对比验证,从而推算出滑块移动的距离,在实际应用中比较常见,我主 ...
BiliBili等网站极验滑动验证码的详细破解过程
基于selenium自动化的滑动验证码破解 selenium python 验证码 1.环境配置(Linux) python2.7 pip安装的库:selenium , PIL Chrome浏览器 , ...
使用java + selenium + OpenCV破解网易易盾滑动验证码
使用java + selenium + OpenCV破解网易易盾滑动验证码网易易盾:dun.163.com * 验证码地址:https://dun.163.com/trial/jigsaw * 使用 ...

selenium+opencv干掉滑动验证码

文章目录

操作流程：

1、找到目标

2、下载验证码图片

3、识别图像戳口

3.1、读取本地图片并展示

3.2、图片灰度处理

3.3、去掉滑块黑色部分

3.4、识别图像位置

4、拖动滑块

4.1、控制滑块滑动

4.2、验证是否滑动成功

代码汇总：

selenium+opencv干掉滑动验证码相关推荐

最新文章

热门文章