最近在学习python爬虫,看到网上有很多关于模拟豆瓣登录的例子,随意找了一个试了下,发现不能运行,对比了一下代码和豆瓣网站,发现原来是豆瓣网站做了修改,增加了反爬措施。

首先看下要模拟登录的网站:

打开开发者模式:

在账号和密码随意填入数据:

发现会发送一个post请求:

ur是:https://accounts.douban.com/j/mobile/login/basic

数据格式是:

于是可以来编写代码:

import requests

def main():

url_basic = 'https://accounts.douban.com/j/mobile/login/basic'

url = 'https://www.douban.com/'

ua_headers = { "User-Agent":'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)'}

data = {

'ck': '',

'name': '自己的账号',

'password': '自己的密码',

'remember': 'false',

'ticket': ''

}

s = requests.session()

s.post(url=url_basic, headers=ua_headers, data=data)

response = s.get(url=url, headers=ua_headers)

with open('douban.html' , 'wb') as f:

f.write(response.content)

if __name__ == '__main__':

main()

第一步:

创建 s = requests.session()

作用是跨请求保持参数,也就是说s这个session对象所发出的所有请求之间会保持cookies

第二步:

用创建好的session对象携带账号,密码去发送post请求。

由于改版后的豆瓣返回的是一个josn数据,而不是像以前一样重定向,所以需要我们来重定向。

第三步:

携带登录成功保存的cookie去访问首页,就会得到你自己的首页.

最后得到个人首页:

以上所述是小编给大家介绍的python模拟豆瓣登录详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

python参考手册 豆瓣_详解python 模拟豆瓣登录(豆瓣6.0)相关推荐

  1. python变量定义大全_详解python变量与数据类型

    这篇文章我们学习 Python 变量与数据类型 变量 变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念,变量可以通过变量名访问.在 Python 中 变量命名规定,必须是大小写英文,数字 ...

  2. python提取hbase数据_详解python操作hbase数据的方法介绍

    配置 thrift python使用的包 thrift 个人使用的python 编译器是pycharm community edition. 在工程中设置中,找到project interpreter ...

  3. python多线程操作列表_详解Python多线程下的list

    list 是 Python 常用的几个基本数据类型之一.正常情况下我们会对 list 有增删改查的操作,显然易见不会有任何问题.那么如果我们试着在多线程下操作list 会有问题吗? 多线程下的 lis ...

  4. python提取邮件附件_详解python实现读取邮件数据并下载附件的实例

    详解python实现读取邮件数据并下载附件的实例 实现结果图: 实现代码: #!/usr/bin/python2.7 # _*_ coding: utf-8 _*_ """ ...

  5. python中byte类型_详解python string类型 bytes类型 bytearray类型

    搜索热词 一.python3对文本和二进制数据做了区分.文本是Unicode编码,str类型,用于显示.二进制类型是bytes类型,用于存储和传输.bytes是byte的序列,而str是unicode ...

  6. python中延时函数_详解python中实现延时回调普通函数

    这篇文章主要给大家介绍了关于python中实现延时回调普通函数的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. 前言 ...

  7. python停止线程池_详解python中Threadpool线程池任务终止示例代码

    需求 加入我们需要处理一串个位数(0~9),奇数时需要循环打印它:偶数则等待对应时长并完成所有任务:0则是错误,但不需要终止任务,可以自定义一些处理. 关键点 定义func函数处理需求 callbac ...

  8. python模块搜索原则_详解python模块路径查找规则及定义

    在python中创建一个模块非常简单,只需要在当前目录下创建一个 .py文件即可,系统自动将其解析成模块,文件名就是模块名.很多我们源码时代的同学都认为在查找模块时优先使用当前目录下的自定义模块.其实 ...

  9. python中index函数_详解python中的index函数用法

    1.函数的创建 def fun(): #定义 print('hellow') #函数的执行代码 retrun 1 #返回值 fun() #执行函数 2.函数的参数 普通参数 :要按照顺序输入参数 de ...

  10. python装饰器由浅入深_详解Python装饰器由浅入深

    装饰器的功能在很多语言中都有,名字也不尽相同,其实它体现的是一种设计模式,强调的是开放封闭原则,更多的用于后期功能升级而不是编写新的代码.装饰器不光能装饰函数,也能装饰其他的对象,比如类,但通常,我们 ...

最新文章

  1. 0x32.数学知识 - 约数
  2. python数据结构与算法分析_数据结构与算法(Python版)
  3. 如何在Rancher 2.2 Preview2上部署和管理多K8s集群应用
  4. 在JavaScript中创建多行字符串
  5. golomb哥伦布编码——本质上就是通过0来区分商和余数
  6. python批量读取grib_windows python读取grib2数据
  7. NOIp2018集训test-9-7(pm) (联考一day1)
  8. SnipperImages(Silverlight DEMO)控件设计之--Slider和ColorSlider
  9. vue引入postcss-plugin-px2rem,px转rem
  10. L :WeChat Walk
  11. ExtAspNet v2.0.6发布 - AJAX性能提升
  12. python tableview 自适应_iOS8下UITableView的contentsize自动变化问题
  13. QuickBI和DataV
  14. iOS:segment对齐原则
  15. 计算机基础知识试题和答案
  16. VirtualBox中不能正常使用OpneGL的问题
  17. 爬虫出现selenium.common.exceptions.NoSuchWindowException: Message: Browsing context has been discarded
  18. 明日之后登录显示服务器连接中断,明日之后连接中断怎么办 无法登陆服务器解决方法...
  19. JavaScript:鼠标拖曳效果
  20. C++ 11 内容总结

热门文章

  1. Win11系统频繁断网怎么办?Win11网络不稳定的解决方法
  2. MYSQL数据库跨服务器实时同步更新实践----文献阅读(污水管网水质预测)
  3. 掌握“盘带技术”——比较磁盘存储和磁带存储
  4. php论坛整合,Dedecms与Discuz论坛整合方法
  5. 一位期货人的总结:大道至简,悟者大成
  6. 计算机病毒与防护学生反思,计算机病毒与防治教学反思
  7. Rabbitmq面试题总结,非常详细,杜绝标题党,不详细你打我,下次不写博客了
  8. cat3速度 rj45_RJ45公对母延长线 网络线纯铜cat5宽带5类0.3米长线
  9. 【SAP Abap】关于销售凭证VBKD业务数据表的使用与注意事项
  10. 520,送你四种Python画玫瑰的方法