文章来源:python干货铺子

前言

验证码往往是爬虫路上的一只拦路虎,而其花样也是层出不穷:图片验证、滑块验证、交互式验证、行为验证等。随着OCR技术的成熟,图片验证已经渐渐淡出主流,而「滑块验证」越来越多地出现在大众视野。“这么厉害,这小子长啥样呢?”没错,它就长这损sai:解决它的方法也很直观,首先找到缺口的位置(通常只需要X轴的位置),然后拖动滑块即可。今天kimol君将带领大家用python识别出滑块验证中的缺口位置。

一、缺口识别

识别图片中的缺口,主要是利用python中的图像处理库cv2,其安装方法如下:

pip install opencv-python

注:这里并不是“pip install cv2”哦~

1.读取图片

滑块验证的图片分为两部分,一个是背景图片:

另一个是缺口图片:

利用imread函数将其读取:

# 读取背景图片和缺口图片

bg_img = cv2.imread('bg.jpg') # 背景图片

tp_img = cv2.imread('tp.png') # 缺口图片

2.识别图片边缘

为了更好地将缺口与背景匹配,我们首先得识别出图片的边缘:

# 识别图片边缘

bg_edge = cv2.Canny(bg_img, 100, 200)

tp_edge = cv2.Canny(tp_img, 100, 200)

这一步很关键!否则缺口匹配将不准确。

这里得到了图片边缘的灰度图,进一步将其图片格式转为RGB格式:

# 转换图片格式

bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)

tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)

转换后的背景图为:

转换后的缺口图为:

3.缺口匹配

利用cv2中的matchTemplate函数,可以在背景图片中搜索对应的缺口,具体代码如下:

# 缺口匹配

res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)

res为每个位置的匹配结果,代表了匹配的概率,选出其中「概率最高」的点,即为缺口匹配的位置:

min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配

min_val,max_val,min_loc,max_loc分别为匹配的最小值、匹配的最大值、最小值的位置、最大值的位置。ps.当然,这里完全可以自己写一个循环来实现,但是有现成的函数为什么不用呢?

至此,我们已经有了缺口的位置,其X轴坐标为:

X = max_loc[0]

为了更直观地展示缺口的位置,我们将缺口用矩形框标注出来:

# 绘制方框

th, tw = tp_pic.shape[:2]

tl = max_loc # 左上角点的坐标

br = (tl[0]+tw,tl[1]+th) # 右下角点的坐标

cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2) # 绘制矩形

cv2.imwrite('out.jpg', bg_img) # 保存在本地

结果如下:完美~ 收工!!!

二、完整代码

为了在实际应用中更方便的使用,我们将代码封装为一个函数:

def identify_gap(bg,tp,out):

'''

bg: 背景图片

tp: 缺口图片

out:输出图片

'''

# 读取背景图片和缺口图片

bg_img = cv2.imread(bg) # 背景图片

tp_img = cv2.imread(tp) # 缺口图片

# 识别图片边缘

bg_edge = cv2.Canny(bg_img, 100, 200)

tp_edge = cv2.Canny(tp_img, 100, 200)

# 转换图片格式

bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)

tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)

# 缺口匹配

res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)

min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配

# 绘制方框

th, tw = tp_pic.shape[:2]

tl = max_loc # 左上角点的坐标

br = (tl[0]+tw,tl[1]+th) # 右下角点的坐标

cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2) # 绘制矩形

cv2.imwrite(out, bg_img) # 保存在本地

# 返回缺口的X坐标

return tl[0]

这里选择了读取本地图片文件,在爬虫过程中其实不是特别方便。如果有感兴趣的小伙伴,可以自己改动一下,将输入改为图片流即可。

写在最后

本文至此便告于段落了,如果需要完整源码或者有任何建议都欢迎私信。最后,感谢各位小伙伴的耐心阅读,咋们下次再会~

寻找不易,大侠请留步… 动起可爱的双手,来个赞再走呗 (๑◕ܫ←๑)

python识别滑块验证码_干掉验证码!使用Python图像识别移动滑块验证码相关推荐

  1. python图像匹配缺口_【kimol君的无聊小发明】—用python识别滑块中的缺口

    [kimol君的无聊小发明]-用python识别滑块中的缺口 前言 一.缺口识别 1.读取图片 2.识别图片边缘 3.缺口匹配 二.完整代码 写在最后 前言 某个夜深人静的夜晚,夜微凉风微扬,月光照进 ...

  2. python识别ppt文件格式 ——(专栏:基于python编写简单office阅卷程序③)

    ● 研二在读学生,非工科非计算机专业,故代码简陋初级勿喷,本文仅为记录和快乐分享. ○ 感谢肯定,感谢点赞收藏分享,转载请注明本页出处即可. ____Ⓙ即刻@王昭没有君 本文仅为笔者摸索总结-欢迎订正 ...

  3. python识别excel文件格式 ——(专栏:基于python编写简单office阅卷程序②)

    ● 研二在读学生,非工科非计算机专业,故代码简陋初级勿喷,本文仅为记录和快乐分享. ○ 感谢肯定,感谢点赞收藏分享,转载请注明本页出处即可. ____Ⓙ即刻@王昭没有君 本文仅为笔者摸索总结-欢迎订正 ...

  4. python识别word文件格式 ——(专栏:基于python编写简单office阅卷程序①)

    ● 研二在读学生,非工科非计算机专业,故代码简陋初级勿喷,本文仅为记录和快乐分享. ○ 感谢肯定,感谢点赞收藏分享,转载请注明本页出处即可. ____Ⓙ即刻@王昭没有君 本文仅为笔者摸索总结-欢迎订正 ...

  5. python识别文字坐标_【Python 教程】使用 Python 和大漠插件进行文字识别

    家里有一台win7系统的电脑,平时可以用来玩玩游戏消磨时间.但是有时候有一些重复的操作实在是无趣,所以打算写个脚本,让其自动化执行. 最终的目标就是把游戏里一些常用的操作都集合到脚本中去,且无序随机执 ...

  6. python识别文字软件_【Python 教程】使用 Python 和大漠插件进行文字识别

    家里有一台win7系统的电脑,平时可以用来玩玩游戏消磨时间.但是有时候有一些重复的操作实在是无趣,所以打算写个脚本,让其自动化执行. 最终的目标就是把游戏里一些常用的操作都集合到脚本中去,且无序随机执 ...

  7. python识别音乐歌曲_如何轻松识别您正在听的歌曲

    python识别音乐歌曲 Do you have a song stuck in your head? Did you listen to a new song and now you're humm ...

  8. python识别图片文字_如何利用Python识别图片中的文字

    一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...

  9. java web项目登录短信验证码_如何在Web项目完成短信验证码

    在做远程智能水表管理系统这个过程有一个功能是在注册页面可以使用手机注册,找了许久才大致了解了手机验证码实现流程,今天在此和大家分享一下. 短信验证码实现流程 1.构造手机验证码:使用random对象生 ...

最新文章

  1. 码云新建仓库,与本地仓库关联
  2. OSChina 周一乱弹 —— 六天颓废一天看剧
  3. 盘点2018十大科技丑闻,IT相关两项
  4. 【蓝桥杯】基础练习 十六进制转八进制(Java实现)
  5. 十大技巧优化Android App性能
  6. 最大似然估计_状态估计的基本概念(2)最大似然估计和最大后验估计
  7. AJAX+JavaScript无刷新检查用户名
  8. 一个Option请求引发的深度解析
  9. 第12课第2.2节 字符设备驱动程序之LED驱动程序_测试改进
  10. apache将请求转发到到tomcat应用
  11. python中reversed函数,Python3
  12. RocketMQ 学习方法之我见
  13. 如何判断2个线段相交
  14. Hadoop2.x HA
  15. 桌面计算机图标怎样优化,桌面图标怎么变小,详细教您电脑桌面图标的太大怎么调小...
  16. 【JAVA】Java 内存模型中的 happen-before
  17. C语言实现RGB888转BMP格式图片功能
  18. 基于点云数据提取道路标线的思路
  19. Huawei 5G MiFi E6878-370 VS E6878-870
  20. ui设计师与android,总算知道ui设计师适配的知识点

热门文章

  1. vue 打印表格需求
  2. Python学习笔记——用户登录测试
  3. 什么标签用于在表单中构建复选框_以下 ( ) 标签用于在表单中构建复选框 。_学小易找答案...
  4. 积跬步至千里,积小流成江海
  5. JS获取父节点、子节点、兄弟节点
  6. 面试鹅厂,我三面被虐的体无完肤
  7. 视觉SLAM ch5代码总结(一)
  8. 苹果手机的图书,如何添加电脑上的书籍如PDF
  9. 智能手机将替代PC成大众最常用终端 智能手机前景无限
  10. 【dp-类背包】Kas 7.4测试 COCI