python脚本根据cookies自动登录网站_python模拟登录并且保持cookie的方法详解
前言
最近在爬行 nosec.org 的数据,看了下需要模拟登录拿到cookie后才能访问想抓的数据,重要的是 nosec.org 的登录页面 form 中有个 authenticity_token 字段每次访问登录页面都会自动生成,而且会和你的用户名,密码一样被POST到服务器。
经过一番研究后发现,直接访问网站登录界面的时候,服务器的响应头会有一个Set-Cookie字段,如下:
_nosec_session=ZTlHNmxuZXE4R0s1UXpsVUxGRTNPblNBWFd2TXU4TU9aNWVJM2lyLzNFY0pLeUdNMDY1cmZqanpkc0ppaGtjU
i9kTGdWenBrNXJKenNqbnN2YUxucE1DRW5UMHNTR1RxWDZPeGlLazllTmY1czVpYWplazJXdWkvZS9wUHJpc1Jya3ZzcmNVMytPR
it2T1dEcGx4bHNDTTVzSmVTb0xhSjRycE03QUl5RXE5Z2tZWG1mTHFBWGx1QW52QjBURi8rLS1acE8yeVRtMFRZR1JWdExneStwdmpRPT0
%3D--a6ccd9a12a8af5c8b5fb6625c24bb4db0398c503; path=/; HttpOnly
而且页面form 的表单有一个 authenticity_token 的 input ,内容如下:
之前按照后端的逻辑分析_nosec_session 的值 经过解密以及各种xx手法得到 authenticity_token 的值,然后顺带着 username 和 password post就行了,最后发现这真是一个大写的傻逼!! 老是用后端的思维思考问题,过不得最近走路都走不好了。所以来,直接在页面中抓取已经生成的 authenticity_token 的值,然后 顺着 POST 过去就好了啊。
使用 requests 库 的 Session()方法,确实很好用,比早期直接拿 cookielib 就干方便多了。
代码
类XXX 的 login 方法用来模拟登录,就贴出这部分登录的代码好了。
class XXX:
def login(self):
r = self.s.get('https://nosec.org/users/sign_in')
html = r.text
p1 = re.compile(r'city_token" value="(.*?)"')
res = re.search(p1,html)
authenticity_token = str(res.group(1))
print 'authenticity_token:',authenticity_token
# print 'cookies',self.s.cookies
# print s.cookies
data = {
'authenticity_token':authenticity_token,
'user[login]':'xxxxx',
'user[password]':'xxxxx'
}
r = self.s.post('https://nosec.org/users/sign_in',data=data)
# print r.headers
# print r.request.headers
# print self.s.cookies
print '[*] OK!'
return True
调用了 login 方法后 下次直接用self.s.get() 请求网页就会带着 cookie 啦。
之前被思路坑了一次,被笔误也坑了一次(https 写成 http),导致我抓狂了好久才发现这个 “BUG” = =、所以还得多谢 代码,提高排 Bug 的效率 2333!
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。
python脚本根据cookies自动登录网站_python模拟登录并且保持cookie的方法详解相关推荐
- python模拟登录网站_Python模拟登录淘宝都实现了,你还怕模拟登录?
文章转载自公众号 :裸睡的猪 , 作者 猪哥66 最近想爬取淘宝的一些商品,但是发现如果要使用搜索等一些功能时基本都需要登录,所以就想出一篇模拟登录淘宝的文章! 看了下网上有很多关于模拟登录淘宝,但是 ...
- python中的map什么意思啊_python中的map怎么使用(方法详解)
python中的map怎么使用? python中map的使用方法: map函数的原型是map(function, iterable, -),它的返回结果是一个列表. 参数function传的是一个函数 ...
- python下载微信公众号文章_python如何导出微信公众号文章方法详解
1.安装wkhtmltopdf 下载地址:https://wkhtmltopdf.org/downloads.html 我测试用的是windows的,下载安装后结果如下 2 编写python 代码导出 ...
- python process 函数_Python Process创建进程的2种方法详解
前面介绍了使用 os.fork() 函数实现多进程编程,该方法最明显的缺陷就是不适用于 Windows 系统.本节将介绍一种支持 Python 在 Windows 平台上创建新进程的方法. Pytho ...
- python 公众号文章发布_python如何导出微信公众号文章方法详解
1.安装wkhtmltopdf 下载地址:https://wkhtmltopdf.org/downloads.html 我测试用的是windows的,下载安装后结果如下 2 编写python 代码导出 ...
- python接收邮件内容启动程序_Python实现发送与接收邮件的方法详解
本文实例讲述了Python实现发送与接收邮件的方法.分享给大家供大家参考,具体如下: 一.发送邮件 这里实现给网易邮箱发送邮件功能: import smtplib import tkinter cla ...
- python导入模块的变量_python 环境变量和import模块导入方法(详解)
1.定义 模块:本质就是.py结尾的文件(逻辑上组织python代码)模块的本质就是实现一个功能 文件名就是模块名称 包: 一个有__init__.py的文件夹:用来存放模块文件 2.导入模块 for ...
- python反向缩进_在Pycharm中对代码进行注释和缩进的方法详解
在Pycharm中对代码进行注释和缩进的方法详解 一.注释 1. #单行注释 2. """ 多行注释 """ 3. pycharm多行注释快 ...
- python脚本根据cookies自动登录网站_Python爬虫如何使用Cookies登录网站
最近搞到了一个学校教务系统可以查询全校成绩的账号,恰逢申请奖学金之际,就想用python写个脚本把年级里的绩点排名给爬下来,可是就在写登录的时候发现还是要处理验证码登录的问题,为了避免麻烦,就没使用类 ...
最新文章
- 求求你别再用offset和limit分页了
- oracle 11g rac手册(第2版) 高清,Oracle Database11g RAC手册(第2版)_IT教程网
- 中国五大物联网平台优势分析
- 用SMO算法实现了SVM的感悟
- 无锁编程(三) - 忙等待
- 《Effective C#》读书笔记——条目23:理解接口方法和虚方法的区别使用C#表达设计...
- 18650锂电池保护板接线图_12v锂电池保护板电路图 - 全文
- 项目绩效考核管理有何方法?这7大考核方案你都知道吗?
- java set拷贝_Java之深浅拷贝
- 2021-2027全球与中国筒式过滤器外壳市场现状及未来发展趋势
- 【利用树莓派制作无线打印服务器】
- Qt5.6.3+VS2013环境搭建教程(最后支持XP系统的Qt版本)
- 如何设置海思开发板的静态IP
- Word文档保存方式谈(转)
- 硅谷最有权势的人:孙正义和他的愿景帝国
- 技美 百人计划 (图形)1.1渲染流程
- Java Class 是什么
- 【含答案】心田花开:小学一年级语文上册期中试卷
- Java三齐王乱点兵算法,【ACM】韩信点兵算法
- Socket 编程实现基于 HTTP 协议的客户和服务
热门文章
- TypeScript里的中括号类型定义法
- SAP Spartacus部署到SAP Commerce Cloud,不同的系统设置不同的OCC Base url
- Chrome开发者工具一个有用的快捷键组合:Ctrl+Shift+E
- SAP Spartacus B2B ListComponent响应回车事件的实现
- Jasmine里的describe,it和expect函数
- Angular DefaultDomRenderer2.setProperty - HTML的值是如何从Angular Component flow过来的,以及跨平台支持
- SAP Cloud for Customer的产品主数据通过PI同步到CRM
- SAP Fiori 1.0和2.0的区别
- request download - 两个队列的研究
- 如何处理Marketing Cloud OData服务的错误消息