网站登录

现在各大平台在反爬虫功能上,可谓花样繁多。总结下来按照破解成功率排名,最高的是滑动解锁、其次是验证码数字、之后是一次点击对应的汉字,最后是想12306之前那种反人类的让你说那些是奶糖吧,哈哈…

为什么我这么排序?很多人可能不赞同,认为验证码数字是最简单的…其实不然,因为验证码数字现在不仅是背景的色块,还穿插这很多混乱的线条,别说是系统识别,就是人仔细看都还会经常出错,所以成功率实在不高。至于滑动解锁,网上教程很多…剩下的两种就难度更高了…

那么如何能跳过这些步骤?在访问前添加cookie,是最简单粗暴的办法!

如何获取cookie

当我们成功登陆网址后,网站会将登陆验证信息保存在浏览器的Headers中,我们通过F12即可获取,但直接从headers中看是long long 的字符串不方便审查,所以切换到cookie栏,如下图:

在cookie中不仅有登陆凭证,还会有很多其他网站附带的属性。此时需要我们过滤掉无关的数据,仅保存我们需要的内容即可。

你问我怎么甄别?如简书这样的,什么local、read_mode、default_font肯定是打酱油的属性,没必要关注。

但上面的__yadk_uid等等的是否需要那就只能靠实验了…先只加token,不行再尝试添加其他的呗。

selenium与cookie有关的方法

selenium中与cookie相关的方法有以下内容:

  • .delete_all_cookies()
  • .get_cookies()/ .get_cookie()
  • .add_cookie()

基本使用场景如下:

当,为了清空或者二次刷新登陆的时候,使用delete_all_cookies删除浏览器所有的cookie数据。

当当,为了获取系统某个或者所有cookie信息是使用get_cookies()/ .get_cookie()。

当当当,我们需要为浏览器添加cookie时,使用add_cookie。这种场景最多…

说的再多,不如来点实际的,设计一套思路来实现这三种方法:

  • 首先,我们访问简书
  • 然后点击登陆,输入用户名密码
  • 等待十秒用来手动完成验证方式
  • 获取get_cookie(key) 和get_cookies()
  • 退出chromedriver
  • 重新访问简书,并添加cookie
  • 再次访问url,看到已经完成了登陆…
# -*- coding: utf-8 -*-
# @Author   : 王翔
# @JianShu  : 清风Python
# @Date     : 2019/7/2 0:55
# @Software : PyCharm
# @version  :Python 3.7.3
# @File     : selenium_cookie.pyfrom selenium import webdriver
import timedriver = webdriver.Chrome()
driver.get("https://www.jianshu.com/u/d23fd5012bed")
driver.delete_all_cookies()
driver.find_element_by_id('sign_in').click()
driver.find_element_by_id('session_email_or_mobile_number').send_keys('username')
driver.find_element_by_id('session_password').send_keys('password')
driver.find_element_by_id('sign-in-form-submit-btn').click()
# 此时我们手动进行登录验证操作操作
time.sleep(10)# cookie 关键字
key = 'remember_user_token'
user_token = driver.get_cookie(key)
print(user_token)
cookies = driver.get_cookies()
print(cookies)
driver.quit()cookie = {'name': key, 'value': user_token['value']}
driver = webdriver.Chrome()
driver.get("https://www.jianshu.com/u/d23fd5012bed")
driver.add_cookie(cookie)
driver.get("https://www.jianshu.com/u/d23fd5012bed")
time.sleep(3)
driver.close()

看看实现效果,为了不暴露用户名密码,所以代码中清空了用户名,暂停手动输入的。
看到终端打印了cookie和cookies,cookie为字典,cookies为包裹了多个字典的列表。之后我们使用cookie进行二次登陆时,通过刷新两次界面看到右上角用户名由未登录变为了登陆:

To Be Continue?

今天的selenium内容就更新到这里,为什么是问号,因为笃定了明天这篇文章浏览量又是几十…不写吧这个系列成了太_监文,写吧完全是给个别人更新的,哎…
OK,如果觉得这篇文章对你有帮助,欢迎将文章或我的微信公众号【清风Python】转发分享给更多喜欢python的朋友们,谢谢。
作者:清风Python

大型情感剧集Selenium:6_selenium中的免密登陆与cookie操作相关推荐

  1. 大型情感剧集Selenium:6_selenium中的免密登陆与cookie操作 #华为云·寻找黑马程序员#

    平常心 昨天因为看小说不方便,所以拿python撸了个小说批量下载工具.为了大家方便所以打包成exe分享给大家. 可今天朋友就说了,这东西不能乱发,不论是各大盗版小说平台,还是淘宝上卖小说的店铺,触及 ...

  2. 大型情感剧集Selenium:6_selenium中的免密登陆与cookie操作 #华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

  3. 大型情感剧集Selenium:4_老中医教你(单/多/下拉框)选项定位 #华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

  4. 大型情感剧集Selenium:3_元素定位 #华为云·寻找黑马程序员#

    关于昨天的文章 今天有朋友反馈,代码运行的时候,selenium提示警告 DeprecationWarning: use options instead of chrome_options drive ...

  5. 大型情感剧集Selenium:2_options设置 #华为云·寻找黑马程序员#

    上集回顾 昨天说简单介绍了什么是selenium,它能干what,和发展史与梗概.当的是python如何通过pip安装selenium,并下载对应浏览器的webdriver. 最后简单通过一个Demo ...

  6. 大型情感剧集Selenium:1_介绍 #华为云·寻找黑马程序员#

    学习selenium能做什么? 很多书籍.文章中是这么定义selenium的: Selenium 是开源的自动化测试工具,它主要是用于Web 应用程序的自动化测试,不只局限于此,同时支持所有基于web ...

  7. 大型情感剧集Selenium:9_selenium配合Pillow完成浏览器局部截图

    网页截图 上次提到了selenium的四种截图方法,最终截图了整张网页.但很多时候,我们仅仅需要截图部分的内容.比如截取某个关键信息,或者现在已经不常见的截图验证码(现在都是各种按规则点击-).那么我 ...

  8. 大型情感剧集Selenium:8_selenium网页截图的四种方法

    有时候,有时候,你会相信一切有尽头-当你的代码走到了尽头,那么保留最后一刻的状态尤为重要,此时你该如何操作?记录日志-没有将浏览器当前的状态进行截图来的直观! 那么,selenium截取截屏,有哪些方 ...

  9. 第六天 - 安装第二、三台CentOS - SSH免密登陆 - hadoop全分布式安装、配置、集群启动

    第六天 - 安装第二.三台CentOS - SSH免密登陆 - hadoop全分布式安装.配置.集群启动 第六天 - 安装第二.三台CentOS - SSH免密登陆 - hadoop全分布式安装.配置 ...

最新文章

  1. [HTTP协议]基础篇-待完结
  2. C语言 素数平方之和
  3. 交叉线和直通线各自用于什么场合?为什么?_都是软电线,BVR与RV有什么不一样?...
  4. Musical Theme
  5. 【转】在ASP.NET Web API 2中使用Owin基于Token令牌的身份验证
  6. (模拟+floyd)Saving James Bond
  7. tomcat安装成功页面翻译
  8. java ipv4和ipv6通信_IPv6与IPv4连接负载
  9. 安装报错_Mysqlclient安装报错的3种情况
  10. 浏览器默认事件,事件监听,事件委托
  11. JDK11.0.9-windows64下载
  12. BP神经网络——激活函数
  13. 什么是设计模式,为什么要使用?
  14. 什么是session
  15. 北大惠普金融指数-匹配企业绿色创新指数2011-2020年:企业名称、年份、行业分类等多指标数据
  16. 教你自制五星级大酒店用的调味品
  17. 能够语义化的编写html文档,HTML语义化 - 写给未来的自己 - OSCHINA - 中文开源技术交流社区...
  18. 6612345免费网页打印浏览器 本软件完全免费,这是一个集网页打印、读取身份证、拍照、读取串口等功能为一体的超级浏览器。
  19. Maven 如何打包 Spring Boot 项目
  20. 新零售模式,数据管理更轻松

热门文章

  1. 避障跟随测距c语言程序,红外避障小车c语言程序.pdf
  2. PHP距离春节还剩多少天,2019年春节倒计时 现在距离2019年春节还有多少天 - 中国万年历...
  3. mysql pconnect_mysql_pconnect()
  4. mysql innodb myisam 区别_InnoDB与MyISAM的六大区别_MySQL
  5. 2019年3月23日
  6. 【转载】gcc 使用中常用的参数及命令
  7. 实战weblogic集群之创建节点和集群
  8. shell 常用命令集合
  9. CodeForces 314C 树状数组 + dp
  10. 凯撒密码和栅栏密码 - 密码学01