文章目录

  • 一.注册超级鹰账户
  • 二.利用超级鹰模拟登录古诗文网
    • 网页分析
    • 代码实现解析
    • 为什么要使用session
  • 三.总结
    • **感谢观看,给个三连支持一下吧**

一.注册超级鹰账户

超级鹰链接:https://www.chaojiying.com/






二.利用超级鹰模拟登录古诗文网

网页分析

这里的headersURL就是登陆的url接口

登陆进去所需要的参数

这张图片就是说明这个网页有MD5的反爬机制存在
这前面那两个参数,都是渲染隐藏在网页标签内的,直接在网页数据源码进行查找就可以

代码实现解析

import requests 是导入一个请求库,用来对网页发起请求

bs4 是一个数据解析库,用来解析网页源代码,从而获取自己需要的数据

超级鹰client是这个验证码第三方打码平台里面一个类,我将它导入过来识别我们的验证码

from hashlib import md5 是一个加密算法,你导入的这个类就是需要导入这个库才能实现

向古诗文网页发起请求 User-Agent就是伪装客户端对网页模拟客户端登录

这一段是对数解析,这里首先是利用bs4解析库创建了一个soup对象,从网页源代码中获取所需要的数据,但是要注意soup返回的是一个数组对象
attrs是获取标签属性的值

此处实例化一个session()对象是因为,我们网页登录每次请求网页验证码都会更新,所以我们要实例化一个session对象让服务器知道是同一客户端对网页发起的请求

为什么要使用session

session对象是一种会话对象,用来记录每个客户端的访问状态,其实,HTTP协议是一种无状态协议,也就是客户端向服务器发送一个请求request,然后服务器返回一个相应response,之后这个连接就会被关闭,两者也没有任何关系了,也就是服务器中不会存储此次请求的有关信息,再次请求时服务器就无法知道这次请求和上次请求是否是一个客户了。所以我们就需要采用会话session来记录这次连接的信息了。
一个客户端访问服务器时,可能会在这个服务器的多个页面之间不断刷新、反复连接同一个页面或者向一个页面提交信息,有了session的记录,服务器就可以知道这就是同一个客户端在完成动作罢了

利用超级鹰识别上面保存的验证码图片

这里就是直接对古诗文网发起请求,为了与前面登录的请求同步所以这里也是用session发起的post请求,最后将获取的古诗文数据源码保存至gushiwen.html文件中,为了测试是否已经获取到了数据源码可以用浏览器打开这个html文件

能开到此界面就说明成功进入了古诗文网

三.总结

本篇文章主要就是学习验证码识别的第三方打码平台超级鹰,以及MD5加密算法,古诗文网的模拟客户端登录,在下篇文章我会继续给大家分享一些干货

感谢观看,给个三连支持一下吧

第三方打码平台超级鹰图文识别,md5算法加密相关推荐

  1. python反爬虫应对之借助平台超级鹰突破网页验证码识别

    在爬虫过程中,有些网页需要登录才能获取里面的数据,在大部分的登录过程中,都会需要一个叫验证码识别,目前的网页有各种各样的验证码,有数字加字母的组合,有物品识别等等 在代码进行网页爬取过程中,如果由人为 ...

  2. 使用第三方打码平台图鉴识别滑动验证码模拟登录

    文章目录 一.图鉴的账户注册 识别流程 二.欧模网案例滑动验证码模拟登录 页面分析 三.代码分析 四.欧模网案例展示 总结 一.图鉴的账户注册 图鉴网页地址: http://www.ttshitu.c ...

  3. python和接码平台对接_python验证码识别接口及识别思路代码

    import os import pytesseract from PIL import Image from collections import defaultdict#tesseract.exe ...

  4. 爬虫进阶之路---处理点触验证码(使用超级鹰API接口处理;以解决12306的图片验证码为例;)

    三大图形验证码之点触验证码 打码平台 超级鹰的使用 12306自动登录 整体代码文件 12306_selenium.py 12306_selenium.py文件代码: chaojiying.py文件代 ...

  5. Python——超级鹰打码平台实现selenium对b站的自动化登陆

    目录 一 .Chrome(谷歌)驱动器的下载 (一)驱动器版本选择 (二)下载Chrome驱动器 二.需要安装的库 (一)安装命令 (二)指定selenium版本原因 三.实现步骤 (一)导入相关库 ...

  6. python爬虫——利用超级鹰识别验证码并进行古诗网进行模拟登录

    目录 前言 一.超级鹰的注册 二.利用xpath解析登录页面的验证码图片 三.利用超级鹰识别获取验证码 四.模拟浏览器发送请求进行模拟登录 五.验证是否模拟登录成功 前言 本文章是利用python爬虫 ...

  7. 爬虫-requests库(四)对接打码平台识别验证码

    以下内容,仅用于学习交流,如有侵权,请联系我删除. 模拟登录经常遇到要输入验证码,有自己写解析验证码识别的,也有用第三方打码平台的,这次说下第三方的打码平台. 首先要找个收费的,免费的太坑了,比如上次 ...

  8. 『python爬虫』26. selenium与超级鹰处理复杂验证码的处理(保姆级图文)

    目录 1. 图片选择类验证码 2. 滑块验证码 3. 滑块出错,不加载 总结 欢迎关注 『python爬虫』 专栏,持续更新中 欢迎关注 『python爬虫』 专栏,持续更新中 1. 图片选择类验证码 ...

  9. 第23讲:利用资源,学会用打码平台处理验证码

    在前一课时我们介绍了多种多样的验证码,有图形文字的.有模拟点选的.有拖动滑动的,但其实归根结底都需要人来对某种情形做一些判断,然后把结果返回并提交.如果此时提交的验证码结果是正确的,并且通过了一些验证 ...

最新文章

  1. Cocos Creator里cc.tween的stopAllActions() 和 repeatForever的用法
  2. Spatial Transformer Networks(STN)代码分析
  3. oracle04052,ORA-04052解决过程
  4. 虚拟机中dns配置好了但是域名ping不同_弱电工程中常用的几个网络命令,学会后轻松变高手...
  5. 【转】2.3SharePoint服务器端对象模型 之 访问网站和列表数据(Part 3)
  6. python读取mysql数据库_Python操作MySQL数据库9个实用实例
  7. max无法创建新的堆栈防护页面_交互设计师,新媒体艺术家们请注意:2019MaxMSP必读书单来袭!...
  8. httpserver
  9. ATL--创建简单的ATL之dll工程,给接口添加属性(实际上就是一个函数对)
  10. 归纳下js面向对象的几种常见写法
  11. Sonarlint代码规范改造实践及一些想法
  12. 2022-LaTex最新官网安装教程
  13. AutoCAD-源泉设计-利器
  14. AdaDelta算法
  15. 图像处理——Haar特征
  16. mappedBy reference an unknown target entity property解决方法
  17. unity3D学习笔记2
  18. zookeeper-集群-选举机制
  19. 08-HTML5详解(二)
  20. Lingo求解线性规划案例1——生产计划问题

热门文章

  1. 将多个class文件打包为jar包
  2. 机器学习中的方差与偏差
  3. arcgis取消投影_ArcGIS中的投影问题
  4. 联通光纤猫虚拟服务器设置,【2017年整理】联通光猫配置操作手册.doc
  5. crontab fastadmin thinkphp 定时任务权限不足
  6. 2021年塔式起重机司机找答案及塔式起重机司机模拟考试软件
  7. 到处excel表格的数据和页面的数据不一致
  8. 项目docker容器化部署步骤
  9. SSH的远程访问及控制
  10. 【Practical】积分第一中值定理