Python识别验证码----谷歌reCapture 4*4验证码

  • 写在前面
  • 数据特点
  • 识别思路
  • 识别结果
  • 改进点

写在前面

近日某众打码平台被跑路的消息一出,脚本圈中一片哗然(我并不是脚本圈的,只是喜欢看群里人吹逼而已 ),仿佛再也听不到那句熟悉的广告语了。这也预示着,第三方打码平台不靠谱了。但打码功能有时候又必不可少,这时候怎么办呢?当然是自己自己动手丰衣足食啦!最近工作不是很忙,准备撸一个用Python识别验证码的系列文章,该系列计划囊括各种时下比较流行的验证码形式,如滑块、四则运算、点选、手势、空间推理、谷歌等。已经跑通了的所有代码都放在了我的知识星球上,需要的话请自取。话不多说,开撸!

数据特点

这类验证码估计大家都碰到过,体验反正有点恶心。

识别思路

1.训练一个deeplab模型来对图片做语义分割,像酱紫:

2.由于打标签实在是太累,以至于我数据没多少,所以光靠语义分割模型来做定位精度肯定是不够的,
于是想了个法子。之前做了个yolo的模型用来定位物体,那么干脆就用yolo模型先大致确定物体的位置,然后再在大致位置内来做语义分割,这样能够减少干扰。实际上这样做确实能提升精度!当然,如果你的数据够多,可以无视这个曲线救国的方式,直接一把梭。

3.根据语义分割的结果来判断要查询的物体临幸了哪些格子,这样就能得出需要点击的格子的编号。

识别结果

大概标注了3000张图的样子,做了个demo(支持的物体有:公交车、小汽车、桥、停车计价器、棕榈树、人行横道、摩托车、消防栓、红绿灯、出租车、自行车、拖拉机、楼梯、烟囱、船、山),效果还凑合。数据越多,泛化性会越强。
原图(找哪里有消防栓):

结果(result里的数字代表十六宫格的序号,1表示第1行第1列,2表示第1行第2列,以此类推):

原图(找哪里有摩托车):

结果(result里的数字代表九宫格的序号,1表示第1行第1列,2表示第1行第2列,以此类推):

改进点

1.数据太少,因为打标签是真的累。。。如果不怕累就多打标签,或者花钱雇人打标签。毕竟没有人工就没有智能。

2.因为数据少,所以才用了曲线救国的方式。如果对精度要求比较高,还是建议多搞数据。

Python识别验证码----谷歌reCapture 4*4验证码相关推荐

  1. Python识别验证码----谷歌reCapture 3*3验证码

    Python识别验证码----谷歌reCapture 3*3验证码 写在前面 数据特点 识别思路 识别结果 改进点 写在前面 近日某众打码平台被跑路的消息一出,脚本圈中一片哗然(我并不是脚本圈的,只是 ...

  2. Python识别验证码----数美图标点选

    Python识别验证码----数美图标点选 写在前面 数据特点 获取数据 识别思路 按顺序抠出F4 定位f4 计算相似度 打标签(~~偷懒~~ ) 训练孪生网络 使用模型 识别结果 改进点 写在前面 ...

  3. Python识别验证码----网易易盾推理拼图

    Python识别验证码----网易易盾拼图推理 写在前面 数据特点 获取数据 识别思路 识别结果 改进点 写在前面 近日某众打码平台被跑路的消息一出,脚本圈中一片哗然(我并不是脚本圈的,只是喜欢看群里 ...

  4. Python模拟登录,Python识别图形验证码实现自动登陆

    前言 利用Python识别图形验证码,selenium模块实现自动登陆.废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: re: numpy模块: pytess ...

  5. python 识别图形验证码_Python验证码识别

    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...

  6. python识别验证码——PIL,pytesser,pytesseract的安装

    1.使用Python识别验证码需要安装Python的图像处理模块(PIL.pytesser.pytesseract) (安装过程需要pip,在我的Python中已经安装pip了,pip的安装就不在赘述 ...

  7. python识别验证码登陆学校网站

    使用技术 网络获取requests 网络解析bs4 验证码识别模块tesserocr 登陆的网站 http://sso.sdwz.cn/cas/captcha 代码 import requests f ...

  8. python识别中文验证码_Python实现验证码识别

    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...

  9. python抓包检测入侵_如果你喜欢python爬虫,不妨看看这篇验证码的抓包技巧与识别!...

    今天要给大家介绍的是验证码的爬取和识别,不过只涉及到最简单的图形验证码,也是现在比较常见的一种类型. 注:想学习Python的小伙伴们进群:984632579领取从0到1完整学习资料 视频 源码 精品 ...

最新文章

  1. run as gradle test,未执行@Test中的内容(待解决)
  2. 【温故知新】CSS学习笔记(盒子内边距介绍)
  3. mysql怎么删除临时表里的数据_谈谈MySQL数据库中临时表的应用
  4. C++模板特化的一个BUG?
  5. libxml的安装和相关数据结构详解
  6. 小型elf Hello,World程序
  7. 重叠面积_20天津中考试卷及答案(24题重叠面积画板制作教程)
  8. IDEA:AbstractMethodError: Receiver class org.jetbrains.plugins.scala ScTraitImpl not define or inher
  9. MongoDB shell
  10. 练习瑜伽中常见的三大误区
  11. ASP.NET 使用C#代码设置页面元素中的样式或属性
  12. R导出可编辑图到ppt:结合使用ggplot2以及officer
  13. cmake_安装导入静态/动态库的三种方式(find_package INSTALL 使用绝对路径)
  14. SVN,HG,GIT 命令说明
  15. DVWA安装教程(Linux)
  16. 什么是SpringDataJPA
  17. VTK学习之一(基本介绍、一个简单的VTK例子)
  18. Bixby在中国市场上线,三星推动智能手机全面跨入AI时代
  19. C++ 基础知识throw的用法
  20. Dreamweaver CC 2018/64位下载地址及安装教程

热门文章

  1. 京东XDD机器人图文详细教程-优雅草科技老八
  2. 学软件的等于电脑高手?
  3. C:1102火车票退票费计算(函数专题)
  4. 关于电脑网络浏览器没有网络,但是QQ和微信可以登录,解决浏览器网络问题
  5. 【微信开发】-发送位置获取周边信息及生成百度全景静态图API,主要代码在private function receiveLocation($object)
  6. DVD转成VOB/MP4/MP3文件
  7. 2019年MongoDB中文社区 上海大会
  8. 多核计算机是指有多个cpu,多核和多个CPU有什么区别?
  9. SIP协议栈OSIP分析
  10. windows如何查看剪贴板历史