Python识别验证码----谷歌reCapture 4*4验证码
Python识别验证码----谷歌reCapture 4*4验证码
- 写在前面
- 数据特点
- 识别思路
- 识别结果
- 改进点
写在前面
近日某众打码平台被跑路的消息一出,脚本圈中一片哗然(我并不是脚本圈的,只是喜欢看群里人吹逼而已 ),仿佛再也听不到那句熟悉的广告语了。这也预示着,第三方打码平台不靠谱了。但打码功能有时候又必不可少,这时候怎么办呢?当然是自己自己动手丰衣足食啦!最近工作不是很忙,准备撸一个用Python识别验证码的系列文章,该系列计划囊括各种时下比较流行的验证码形式,如滑块、四则运算、点选、手势、空间推理、谷歌等。已经跑通了的所有代码都放在了我的知识星球上,需要的话请自取。话不多说,开撸!
数据特点
这类验证码估计大家都碰到过,体验反正有点恶心。
识别思路
1.训练一个deeplab模型来对图片做语义分割,像酱紫:
2.由于打标签实在是太累,以至于我数据没多少,所以光靠语义分割模型来做定位精度肯定是不够的,
于是想了个法子。之前做了个yolo的模型用来定位物体,那么干脆就用yolo模型先大致确定物体的位置,然后再在大致位置内来做语义分割,这样能够减少干扰。实际上这样做确实能提升精度!当然,如果你的数据够多,可以无视这个曲线救国的方式,直接一把梭。
3.根据语义分割的结果来判断要查询的物体临幸了哪些格子,这样就能得出需要点击的格子的编号。
识别结果
大概标注了3000张图的样子,做了个demo(支持的物体有:公交车、小汽车、桥、停车计价器、棕榈树、人行横道、摩托车、消防栓、红绿灯、出租车、自行车、拖拉机、楼梯、烟囱、船、山),效果还凑合。数据越多,泛化性会越强。
原图(找哪里有消防栓):
结果(result里的数字代表十六宫格的序号,1表示第1行第1列,2表示第1行第2列,以此类推):
原图(找哪里有摩托车):
结果(result里的数字代表九宫格的序号,1表示第1行第1列,2表示第1行第2列,以此类推):
改进点
1.数据太少,因为打标签是真的累。。。如果不怕累就多打标签,或者花钱雇人打标签。毕竟没有人工就没有智能。
2.因为数据少,所以才用了曲线救国的方式。如果对精度要求比较高,还是建议多搞数据。
Python识别验证码----谷歌reCapture 4*4验证码相关推荐
- Python识别验证码----谷歌reCapture 3*3验证码
Python识别验证码----谷歌reCapture 3*3验证码 写在前面 数据特点 识别思路 识别结果 改进点 写在前面 近日某众打码平台被跑路的消息一出,脚本圈中一片哗然(我并不是脚本圈的,只是 ...
- Python识别验证码----数美图标点选
Python识别验证码----数美图标点选 写在前面 数据特点 获取数据 识别思路 按顺序抠出F4 定位f4 计算相似度 打标签(~~偷懒~~ ) 训练孪生网络 使用模型 识别结果 改进点 写在前面 ...
- Python识别验证码----网易易盾推理拼图
Python识别验证码----网易易盾拼图推理 写在前面 数据特点 获取数据 识别思路 识别结果 改进点 写在前面 近日某众打码平台被跑路的消息一出,脚本圈中一片哗然(我并不是脚本圈的,只是喜欢看群里 ...
- Python模拟登录,Python识别图形验证码实现自动登陆
前言 利用Python识别图形验证码,selenium模块实现自动登陆.废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: re: numpy模块: pytess ...
- python 识别图形验证码_Python验证码识别
大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...
- python识别验证码——PIL,pytesser,pytesseract的安装
1.使用Python识别验证码需要安装Python的图像处理模块(PIL.pytesser.pytesseract) (安装过程需要pip,在我的Python中已经安装pip了,pip的安装就不在赘述 ...
- python识别验证码登陆学校网站
使用技术 网络获取requests 网络解析bs4 验证码识别模块tesserocr 登陆的网站 http://sso.sdwz.cn/cas/captcha 代码 import requests f ...
- python识别中文验证码_Python实现验证码识别
大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...
- python抓包检测入侵_如果你喜欢python爬虫,不妨看看这篇验证码的抓包技巧与识别!...
今天要给大家介绍的是验证码的爬取和识别,不过只涉及到最简单的图形验证码,也是现在比较常见的一种类型. 注:想学习Python的小伙伴们进群:984632579领取从0到1完整学习资料 视频 源码 精品 ...
最新文章
- run as gradle test,未执行@Test中的内容(待解决)
- 【温故知新】CSS学习笔记(盒子内边距介绍)
- mysql怎么删除临时表里的数据_谈谈MySQL数据库中临时表的应用
- C++模板特化的一个BUG?
- libxml的安装和相关数据结构详解
- 小型elf Hello,World程序
- 重叠面积_20天津中考试卷及答案(24题重叠面积画板制作教程)
- IDEA:AbstractMethodError: Receiver class org.jetbrains.plugins.scala ScTraitImpl not define or inher
- MongoDB shell
- 练习瑜伽中常见的三大误区
- ASP.NET 使用C#代码设置页面元素中的样式或属性
- R导出可编辑图到ppt:结合使用ggplot2以及officer
- cmake_安装导入静态/动态库的三种方式(find_package INSTALL 使用绝对路径)
- SVN,HG,GIT 命令说明
- DVWA安装教程(Linux)
- 什么是SpringDataJPA
- VTK学习之一(基本介绍、一个简单的VTK例子)
- Bixby在中国市场上线,三星推动智能手机全面跨入AI时代
- C++ 基础知识throw的用法
- Dreamweaver CC 2018/64位下载地址及安装教程
热门文章
- 京东XDD机器人图文详细教程-优雅草科技老八
- 学软件的等于电脑高手?
- C:1102火车票退票费计算(函数专题)
- 关于电脑网络浏览器没有网络,但是QQ和微信可以登录,解决浏览器网络问题
- 【微信开发】-发送位置获取周边信息及生成百度全景静态图API,主要代码在private function receiveLocation($object)
- DVD转成VOB/MP4/MP3文件
- 2019年MongoDB中文社区 上海大会
- 多核计算机是指有多个cpu,多核和多个CPU有什么区别?
- SIP协议栈OSIP分析
- windows如何查看剪贴板历史