这篇文章主要介绍了python爬虫 模拟登录人人网过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
equests 提供了一个叫做session类,来实现客户端和服务端的会话保持

使用方法

1.实例化一个session对象

2.让session发送get或者post请求

session = requests.session()
session.get(url,headers)

下面就用人人网来实战一下

# coding=utf-8
import requests
session = requests.session()
# 登录的表单url
post_url = "http://www.renren.com/PLogin.do"
post_data = {"email": "your_email", "password": "your_password"}
headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"
}
# 使用session发送post请求,cookie保存在其中
session.post(post_url, data=post_data, headers=headers)
# 在使用session进行请求登陆之后才能访问的地址
# 这是个人首页url
r = session.get("http://www.renren.com/327550088/profile", headers=headers)
# 保存页面到本地
with open("renren1.html", "w", encoding="utf-8") as f:f.write(r.content.decode('utf-8'))

就这么简单,模拟登录上人人网并且获取了个人首页信息页面保存到本地。

其实网站记录登录状态就是通过cookie里面携带的信息,如果我们发送请求的时候带上登录的cookie能不能够访问到只有登录才能访问的页面,当然是可以的

请看代码

# coding=utf-8
import requests
headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36","Cookie":"你的登录cookie"
}
r = requests.get("http://www.renren.com/327550088/profile",headers=headers)
#保存页面
with open("renren2.html","w",encoding="utf-8") as f:f.write(r.content.decode())

可以看到, Cookie 可以放在 headers 中,其实 requests 中也有一个参数用来传递cookie,这个参数就是 cookies

请看代码

# 字典生成器的用法
cookies = {i.split("=")[0]:i.split("=")[1] for i in cookies.split("; ")}
print(cookies)
r = requests.get("http://www.renren.com/327550088/profile",headers=headers,cookies=cookies)
``
写到这里,给大家推荐一个资源很全的python学习聚集地,[点击进入](https://jq.qq.com/?_wv=1027&k=5JIjRvv),这里有资深程序员分享以前学习心得,学习笔记,还有一线企业的工作经验,且给大家精心整理一份python零基础到项目实战的资料,每天给大家讲解python最新的技术,前景,学习需要留言的小细节`以上就是本文的全部内容,希望对大家的学习有所帮助

python爬虫 模拟登录人人网过程解析相关推荐

  1. python爬虫模拟登录人人网

    模拟登录:爬取基于某些用户的用户信息. 需求1:对人人网进行模拟登录. 点击登录按钮之后会发起一个post请求 post请求中会携带登录之前录入的相关的登录信息(用户名,密码,验证码-) 验证码:每次 ...

  2. python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例

    转载请注明出处:python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例 我们在前面的文章中已经学习了如果使用python进行数据抓取. 但我们常常会遇到一种场景,就是想要获取的页面内容或者接 ...

  3. python爬虫登陆教程_(python模拟登陆教程)python爬虫模拟登录是什么意思

    python爬虫模拟登录是什么意思 网站需要登录后才能所需要的信息,此时可以设计爬虫进拟登录,原理是利用浏cookie. 一.浏览器访问服务器的过程: (1)浏览器(客户端)向Web服务器发出一个HT ...

  4. 【Python技能树共建】Python爬虫模拟登录

    Python 爬虫模拟登录 Python 爬虫模拟登录是使用脚本实现自动登录,部分站点需要逆向加密逻辑,更多的站点会采用验证码进行鉴权验证. 本文为大家带来最简单的登录,其核心用到的是 request ...

  5. python登录教务系统_强智科技教务系统python爬虫模拟登录分析(湖南)

    强智科技教务系统python爬虫模拟登录分析(湖南) 本文章仅用作于学习 前提:最近期末到来,想第一时间看到新出成绩的,于是就有了爬取学校教务系统自己的成绩并通过Qmsg酱推送到自己QQ上的想法,目前 ...

  6. 利用python爬虫自动登录人人网

    刚学python爬虫,使用python爬虫自动登录人人网,在运行代码时一直报错HTTPError /syshome urllib.error可以接收有urllib.request产生的异常.urlli ...

  7. 用python实现模拟登录人人网

    我决定从头说起.懂的人可以快速略过前面理论看最后几张图. web基础知识 从OSI参考模型(从低到高:物理层,数据链路层,网络层,传输层,会话层,表示层,应用层)来说,我们的互联网属于应用层.从TCP ...

  8. python模拟登录网站_用python实现模拟登录人人网

    我决定从头说起.懂的人可以快速略过前面理论看最后几张图. web基础知识 从OSI参考模型(从低到高:物理层,数据链路层,网络层,传输层,会话层,表示层,应用层)来说,我们的互联网属于应用层.从TCP ...

  9. 枯燥的寒假生活(一) python爬虫模拟登录whu老教务系统获取期末考试成绩(已失效 , 老教务系统增加了新的反爬, 老教务系统已停用)

    python模拟登录老教务系统(2021.6.24更新) 一.写在前面 之前用爬虫爬取的都是静态网页html中的内容,但是大多数时候需要动态处理网页爬取数据.因为学校出成绩太慢了,每次都自己打开浏览器 ...

最新文章

  1. Eclipse 的IOConsole Updater error
  2. C指针笔试题,蛋疼的多重指针运算,谭浩强的阴影
  3. C程序运用递归求阶乘
  4. tomcat(11)org.apache.catalina.core.StandardWrapper源码剖析
  5. eclipse中java.lang.OutOfMemoryError: Java heap space错误
  6. nacos怎么修改服务分组_Nacos(六):多环境下如何“管理”及“隔离”配置和服务...
  7. 特斯拉又熬过破产危机后,马斯克说自动驾驶芯片已经准备好了
  8. 北风设计模式课程---外观模式、代理模式和中介者模式的区别
  9. python 微信公众号发文章_Python 微信公众号文章爬取
  10. vue-echarts教程
  11. js使用高德地图api实现定位,行政区域划分,点击事件,只显示某个省市或区,海量点标记
  12. 跟熊浩学沟通30讲读后感_跟熊浩学沟通
  13. 前端实现图片压缩—压缩图片大小,画质(两种方式)
  14. 炭黑是做什么用的 炭黑起什么作用
  15. 【HTML/CSS】HTML/CSS个人学习总结
  16. Linux sdkman使用方法
  17. demo爬腾讯视频,保存为MP4
  18. python爬虫豆瓣电影评价_使用爬虫爬取豆瓣电影影评数据Python版
  19. margin 重叠问题的理解
  20. python技术介绍_Python介绍

热门文章

  1. Github的wiki编写
  2. 光伏多峰最大功率点跟踪MPPT MATLAB/Simulink仿真模型
  3. 【机器学习】skit-learn中LSI模型的实现
  4. nao机器人拆解_两周年了 Pepper都经历了什么呢?
  5. 实战分享:一文读懂RS-232总线
  6. Ubuntu16.04 U盘安装Ubuntu16.04制作 光盘刻录 安装与简介
  7. 搭积木(block)
  8. php不能使用class,php – 致命错误:不能使用stdClass类型的对象作为数组
  9. ecg 幅度_ECG信号分析流程
  10. 【总结整理】产品经理优秀品质----《结网》