我们在用自动化测试来做爬虫的时候,总是会遇见很多的验证码,其中的滑块拼接验证就是其中一种;selenium是一个自动化测试库,opencv是计算机视觉库,我们可以用这两个库来模仿人工滑动验证码,完成验证码验证操作!

文章目录

  • 操作流程:
    • 1、找到目标
    • 2、下载验证码图片
    • 3、识别图像戳口
      • 3.1、读取本地图片并展示
      • 3.2、图片灰度处理
      • 3.3、去掉滑块黑色部分
      • 3.4、识别图像位置
    • 4、拖动滑块
      • 4.1、控制滑块滑动
      • 4.2、验证是否滑动成功
  • 代码汇总:

目标网站: http://dun.163.com/trial/sense
完成对象:

操作流程:

1、找到目标

  • 这里我们需要使用selenium库来模拟操作浏览器,可以通过pip install selenium安装它,同时需要下载对应浏览器版本的webdriver来辅助控制电脑,这里就不详细讲解了,直接看操作流程:
from selenium import webdriver
import time#创建浏览器
driver = webdriver.Chrome()#输入网址,打开该网站
driver.get('http://dun.163.com/trial/sense')#点击网页
#1、点击选择“可疑用户-滑动拼图”
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/ul/li[2]').click()
time.sleep(1)#等待加载
#2、点击验证码位置“请完成安全验证”
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[1]/span').click()
  • 通过上面的流程找到验证码的位置,开始获取验证码图片

2、下载验证码图片

  • 从网页中,我们可以看出这是两张图片:
  • 现在需要把这两张图片下载到本地文件
    #获取到两张图片链接bg_img_scr = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[1]').get_attribute('src')front_img_src = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[2]').get_attribute('src')#把图片下载到本地with open('./bg.jpg',mode='wb') as f:f.write(requests.get(bg_img_scr).content)f.close()with open('./front.jpg',mode='wb') as f:f.write(requests.get(front_img_src).content)f.close()

3、识别图像戳口

3.1、读取本地图片并展示

  • 这里包含三个部分,分别为:读取,展示,释放,缺一不可。
import cv2
#读取图片
bg = cv2.imread('./bg.jpg')
front = cv2.imread('./front.jpg')#展示图片
cv2.imshow('gray1',bg)#gray1,gray2是窗口名称
cv2.imshow('gray2',front)#释放资源
cv2.waitKey(0)#按任意键退出图片展示
cv2.destroyAllWindows()

展示结果:

3.2、图片灰度处理

  • 图片灰度处理的目的是让颜色方差更明显
#灰度处理
bg = cv2.cvtColor(bg,cv2.COLOR_BGR2GRAY)
front = cv2.cvtColor(front,cv2.COLOR_BGR2GRAY)

3.3、去掉滑块黑色部分

  • 目的是为了和背景图片进行匹配
front = front[front.any(1)]#0表示黑色,1表示高亮部分

3.4、识别图像位置

  • 通过这个算法,图像从左上角开始匹配,进行像素点对比,并记录每个像素点的数值,以多维数组的方式返回
  • 通过numpy将数组变为一维数组,索引出最大值的位置。
import numpy as np
#匹配->cv图像匹配算法
result = cv2.matchTemplate(bg, front, cv2.TM_CCOEFF_NORMED)#match匹配,Template模板;精度高,速度慢的方法
index_max = np.argmax(result)#返回的是一维的位置,最大值索引
  • 根据一维数组的位置反推出二维数组中的位置。
#反着推最大值的二维位置,和opencv是相反的
x, y = np.unravel_index(index_max, result.shape)
print ("二维中坐标的位置:",x, y)
二维中坐标的位置: 79 145
  • 这个位置就是戳口的位置

注意: opencv的坐标与坐标轴的是相反的。

4、拖动滑块

4.1、控制滑块滑动

from selenium.webdriver.common.action_chains import ActionChains
drop = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[2]/div[2]')
ActionChains(driver).drag_and_drop_by_offset(drop, xoffset=y, yoffset=0).perform()

4.2、验证是否滑动成功

  • 当验证通过后,滑动底的部会出现“验证成功”,如图:
  • 可以通过检查这个文字判断是否验证成功,如果第一次验证失败,可以继续验证,直到成功为止!
    success = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[2]/span[2]').textif success == '验证成功':            breakelse:print ('第%s次验证失败...'%k,'\n')

代码汇总:

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time,requests
import cv2
import numpy as np#创建浏览器
driver = webdriver.Chrome()#输入网址,打开该网站
driver.get('http://dun.163.com/trial/sense')#点击网页
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/ul/li[2]').click()
time.sleep(1)
driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[1]/span').click()
time.sleep(1)k = 1
while True:#获取到两张图片链接bg_img_scr = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[1]').get_attribute('src')front_img_src = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[1]/div/div[1]/img[2]').get_attribute('src')#把图片下载到本地with open('./bg.jpg',mode='wb') as f:f.write(requests.get(bg_img_scr).content)f.close()with open('./front.jpg',mode='wb') as f:f.write(requests.get(front_img_src).content)f.close()#读取图片bg = cv2.imread('./bg.jpg')front = cv2.imread('./front.jpg')#灰度处理bg = cv2.cvtColor(bg,cv2.COLOR_BGR2GRAY)front = cv2.cvtColor(front,cv2.COLOR_BGR2GRAY)#去掉滑块黑色部分front = front[front.any(1)]#0表示黑色,1表示高亮部分#匹配->cv图像匹配算法result = cv2.matchTemplate(bg, front, cv2.TM_CCOEFF_NORMED)#match匹配,Template模板;精度高,速度慢的方法index_max = np.argmax(result)#返回的是一维的位置,最大值索引#反着推最大值的二维位置,和opencv是相反的x, y = np.unravel_index(index_max, result.shape)print ("二维中坐标的位置:",x, y)print ("正在进行第%s次滑动验证"%k)drop = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[2]/div/div/div[2]/div[2]')    ActionChains(driver).drag_and_drop_by_offset(drop, xoffset=y, yoffset=0).perform()time.sleep(1)#验证成功后获取“验证成功”,直到找到“验证成功”才跳出while True循环success = driver.find_element_by_xpath('/html/body/main/div[1]/div/div[2]/div[2]/div[1]/div[2]/div[1]/div/div[2]/div[3]/div/div/div[1]/div[2]/span[2]').textif success == '验证成功':            breakelse:print ('第%s次验证失败...'%k,'\n')k = k + 1
print ('已经通过验证码!!!')

运行结果:

二维中坐标的位置: 50 258
正在进行第1次滑动验证
第1次验证失败... 二维中坐标的位置: 79 145
正在进行第2次滑动验证
已经通过验证码!!!

selenium+opencv干掉滑动验证码相关推荐

  1. python+selenium+chrome 做滑动验证码 会被浏览器检测到使用的自动软件导致滑动验证失败

    python+selenium+chrome 做滑动验证码 会被浏览器检测到使用的自动软件导致滑动验证失败 解决方法:代码中添加: import time from selenium import w ...

  2. selenium爬虫|破解滑动验证码以极验为例

    爬虫访问一些网站遇到滑动验证码解决方案 这里是用selenium做模拟,如果是requests可以封装这个登录方法来获取登录后的cookies也是可以用的. 1 思路 先讲思路,分析流程 我们输入账号 ...

  3. selenium篇之滑动验证码

    一.介绍 现在出现了一种通过用户鼠标移动滑块来填补有缺口图片的验证码,我们叫做滑动验证码.它的原理很简单,首先生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以 ...

  4. 基于nodejs+selenium自动过滑动验证码的QQ刷赞

    引子 不知道大家是否还记得之前让我刷赞的小朋友,自从他回到学校后,可能是由于学业太忙,把我们组成刷赞团队的事情忘记了,只是每天早上给我发信息帮他刷赞,迟迟没有新的用户,刷赞就没有量产的动力,我怠慢了几 ...

  5. selenium破解bilbili滑动验证码

    登陆b站的时候大家都会见到滑动验证码,打开开发者工具分析一下这里的验证码 1:首先需要鼠标触碰到滑动按钮才会显示出完整的验证码图片 2:点击按钮出现缺口图片 3:查看图片元素会(打开图片链接)发现完整 ...

  6. selenium登录 京东滑动验证码

    京东的滑动验证码在页面上是没有原图的,所有我是用ps把他们拼成一个的. from selenium import webdriver from selenium.webdriver import Ac ...

  7. selenium自动化案例(二)滑动验证码破解

    文章目录 写在前面 大致思路 Python实现 几个小坑 写在前面 最近学习了滑动验证的一个破解思路,是利用OpenCV的图形匹配算法进行对比验证,从而推算出滑块移动的距离,在实际应用中比较常见,我主 ...

  8. BiliBili等网站极验滑动验证码的详细破解过程

    基于selenium自动化的滑动验证码破解 selenium python 验证码 1.环境配置(Linux) python2.7 pip安装的库:selenium , PIL Chrome浏览器 , ...

  9. 使用java + selenium + OpenCV破解网易易盾滑动验证码

    使用java + selenium + OpenCV破解网易易盾滑动验证码 网易易盾:dun.163.com * 验证码地址:https://dun.163.com/trial/jigsaw * 使用 ...

最新文章

  1. 70.nodejs操作mongodb
  2. angular select设置默认选中_改进 Angular + Jest 项目中组件测试的调试
  3. R语言使用GGally包的ggpairs函数可视化变量相关性分析图:包含散点图、密度图、柱状图、箱图等、并自定义数据点的大小
  4. torch.nn.functional.pad
  5. java round number,Java Number Math 类
  6. 使用SVD求取矩阵的伪逆
  7. dns tunnel CC
  8. 学编程又一火爆网站:哔哩哔哩
  9. java poi之Excel的读取
  10. 清华大学朱旭峰:中国智库大数据报告2017预发布
  11. MyBatis框架 注解
  12. 程序员入职 6 天即被开除:项目丢了,新人背锅?
  13. 离线版MSDN下载地址
  14. 在虚拟机上搭建中标麒麟Neokylin6桌面版开发环境
  15. windows 强制关闭程序并强制删除文件
  16. 木马万能查杀清除方法,木马专杀
  17. emv交易流程介绍,简易波动指标EMV基础知识介绍:EMV的计算公式_EMV应用法则
  18. Linux 字体管理相关
  19. 教你Zbrush 4R7增强光滑笔刷强度方法
  20. Java实现统计字符次数(按大写、小写、数字来统计)

热门文章

  1. spark filter 堆栈溢出
  2. ssh汉字乱码怎么办_SSH 中文乱码解决
  3. 以太坊私链搭建(二)——genesis.json字段解读
  4. Capture One Pro 12常用技巧(二)
  5. 计算机开机先检测什么问题,电脑按下开机键后 没反应 但检测电源却没有問題,是什么情况?...
  6. 系统重装之后查看否激活成功
  7. UIToolbar背景透明设置
  8. 睡眠即醒 蓝牙_众人皆睡你独醒?Bose遮噪睡眠耳塞用黑科技助你酣睡!
  9. hadoop HA 常见错误
  10. vscode设置快捷键删除行