有些网页需要你登录之后才可以访问,你需要提供账户和密码。

只要在发送http请求时,带上含有正常登陆的cookie就可以了。

1、首先我们要先了解cookie的工作原理。

Cookie是由服务器端生成,发送给User-Agent(一般是浏览器),浏览器会将Cookie的key/value保存到某个目录下的文本文件内,下次请求同一网站时就发送该Cookie给服务器(前提是浏览器设置为启用cookie)。Cookie名称和值可以由服务器端开发自己定义,对于JSP而言也可以直接写入jsessionid,这样服务器可以知道该用户是否合法用户以及是否需要重新登录等。

2、之后我们要获取到用户正常登录的cookie.

python提供了cookieJar的库,只要把cookieJar的实例作为参数传到urllib2的一个opener里面。

然后访问一次登录的页面,cookie就已经保存下来了。之后通过这个实例访问所有的页面都带有正常登陆的cookie了。

以人人网为例子。

#encoding=utf-8

import urllib2

import urllib

import cookielib

def renrenBrower(url,user,password):

#登陆页面,可以通过抓包工具分析获得,如fiddler,wireshark

login_page = "http://www.renren.com/PLogin.do"

try:

#获得一个cookieJar实例

cj = cookielib.CookieJar()

#cookieJar作为参数,获得一个opener的实例

opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

#伪装成一个正常的浏览器,避免有些web服务器拒绝访问。

opener.addheaders = [('User-agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]

#生成Post数据,含有登陆用户名密码。

data = urllib.urlencode({"email":user,"password":password})

#以post的方法访问登陆页面,访问之后cookieJar会自定保存cookie

opener.open(login_page,data)

#以带cookie的方式访问页面

op=opener.open(url)

#读取页面源码

data= op.read()

return data

except Exception,e:

print str(e)

#访问某用户的个人主页,其实这已经实现了人人网的签到功能。

print renrenBrower("http://www.renren.com/home","用户名","密码")

以上这篇python 实现登录网页的操作方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

python登录网页并操作_python 实现登录网页的操作方法相关推荐

  1. python获取接口返回值_Python+request 登录接口reponse的返回值token跨py文件的传递《二》...

    主要使用场景: 一般我们在进行接口测试时,依赖登录接口后reponse中的某些返回值,因此需要将login接口单独写一个py文件,另外的py文件均可调用login的reponse返回值使用.共用登录接 ...

  2. python模拟登录qq账号密码_Python自动登录QQ的实现示例

    这是一份来自网络的代码,经过了我的修改和验证. 首先我的运行环境是Python3.7,需要安装PyUserInput库. 直接上代码吧: #!/usr/bin/python import os imp ...

  3. php qq三方登录,php如何操作qq第三方登录

    本文主要和大家分享php操作qq第三方登录实例代码,希望能帮助到大家. 1.首先进入connect.qq.com进行登录注册认证等相关信息 2.配置应用的回调域等相关信息(十分重要) 3.下载php版 ...

  4. 【Linux】Linux 记录和查看登录日和操作志|查看登录历史

    目录 零.查看最近登录ip 以及历史命令执行日期 查看当前登录用户信息 一.查看日志文件 二. 脚本生成所有登录用户的操作历史 显示历史命令和时间history 零.查看最近登录ip 以及历史命令执行 ...

  5. python登录网页后打印_python爬虫中文网页cmd打印出错问题解决

    问题描述 用python写爬虫,很多时候我们会先在cmd下先进行尝试. 运行爬虫之后,肯定的,我们想看看爬取的结果. 于是,我们print... 运气好的话,一切顺利.但这样的次数不多,更多地,我们会 ...

  6. python怎么登录微博并发微博_Python代码登录新浪微博并自动发微博

    前言 对于很少玩微博@張行之_的我来说,微博内容少的可怜.所以本人就想:能不能写个成功程序来帮我发微博.这个程序要满足以下要求: 自动化,自动登录微博,自动发微博. 微博内容要有意义,不能是随机生成的 ...

  7. python获取cookie的方法_python实现登录后获取cookie并用于之后的请求

    初学python接口自动化,一些经验总结,希望遇到同样问题的小伙伴能较快解决: 依据项目的实现逻辑,用户发表评论时需检测用户当前为登录状态,即校验cookie. 用户登录后在响应头里可见到Set-co ...

  8. python写一个自动登录脚本_Python 脚本登录交换机实现自动配置备份

    Python 脚本登录交换机实现自动配置备份 一.Python脚本 ssh = paramiko.SSHClient() ssh.set_missing_host_key_policy(paramik ...

  9. python模拟登录爬取数据_python 模拟登录爬取淘宝数据

    淘宝现在需要登录才能爬取搜索商品,首先在登录页面登录chrome F12 开发者模式抓包 登录请求 发现有一个post请求,这个就是登录的请求了,看下面的from data 登录信息 由from da ...

  10. python网页结构分析图_Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存中, ...

最新文章

  1. Community Server页面布局
  2. pve安装黑群晖直通硬盘_在Proxmox VE(PVE)安装黑群晖
  3. SAP 不同 ABAP 系统里同一 Customizing activity 的显示差异分析
  4. 安卓APP_ 布局(2) —— RelativeLayout相对布局
  5. 一起动手打造个人娱乐级linux
  6. java volatile 原子性_Java中volatile不能保证原子性的证明
  7. django模块导入/函数/中间件/MVC和MTV/CSRF
  8. 算法面试:精选微软经典的算法面试100题(第21-25题)
  9. 第二章 C++对C的改进和扩展
  10. LayaAir 定时器 Timer
  11. 西门子g120变频器接线图_西门子G120变频器参数设置,快速使用
  12. 美国密歇根州立大学计算机专业,密歇根州立大学计算机科学与工程系
  13. python爬虫 requests使用代理ip
  14. 今日金融词汇---股价复权,是什么?
  15. 移动用户免费领取15G流量(秒到)
  16. 安卓:点击空白处隐藏软键盘
  17. TensorFlow-similarity 学习笔记13
  18. 搭建DVWA出现错误:DVWA System error - config file not found.
  19. edg击败we视频_超神圣枪无情屠杀 EDG击败WE全取三分
  20. 安徽大学计算机科学与技术学院施俊,上海大学教授施俊应邀来我院做学术报告...

热门文章

  1. POJ:3126-Prime Path
  2. 《TCP/IP 详解 卷1:协议》第 2 章:Internet 地址结构
  3. 201521123115 《Java程序设计》第3周学习总结
  4. 快速排序及快速选择问题
  5. Java Android 代码片段收集
  6. OSPF邻接关系状态机
  7. WLAN射频、信道与帧分类
  8. DHCP技术原理详解
  9. python成长之路--python的安装与配置 pycharm的安装与激活
  10. CodeForces 622A--F - Infinite Sequence