python登录网页并操作_python 实现登录网页的操作方法
有些网页需要你登录之后才可以访问,你需要提供账户和密码。
只要在发送http请求时,带上含有正常登陆的cookie就可以了。
1、首先我们要先了解cookie的工作原理。
Cookie是由服务器端生成,发送给User-Agent(一般是浏览器),浏览器会将Cookie的key/value保存到某个目录下的文本文件内,下次请求同一网站时就发送该Cookie给服务器(前提是浏览器设置为启用cookie)。Cookie名称和值可以由服务器端开发自己定义,对于JSP而言也可以直接写入jsessionid,这样服务器可以知道该用户是否合法用户以及是否需要重新登录等。
2、之后我们要获取到用户正常登录的cookie.
python提供了cookieJar的库,只要把cookieJar的实例作为参数传到urllib2的一个opener里面。
然后访问一次登录的页面,cookie就已经保存下来了。之后通过这个实例访问所有的页面都带有正常登陆的cookie了。
以人人网为例子。
#encoding=utf-8
import urllib2
import urllib
import cookielib
def renrenBrower(url,user,password):
#登陆页面,可以通过抓包工具分析获得,如fiddler,wireshark
login_page = "http://www.renren.com/PLogin.do"
try:
#获得一个cookieJar实例
cj = cookielib.CookieJar()
#cookieJar作为参数,获得一个opener的实例
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
#伪装成一个正常的浏览器,避免有些web服务器拒绝访问。
opener.addheaders = [('User-agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]
#生成Post数据,含有登陆用户名密码。
data = urllib.urlencode({"email":user,"password":password})
#以post的方法访问登陆页面,访问之后cookieJar会自定保存cookie
opener.open(login_page,data)
#以带cookie的方式访问页面
op=opener.open(url)
#读取页面源码
data= op.read()
return data
except Exception,e:
print str(e)
#访问某用户的个人主页,其实这已经实现了人人网的签到功能。
print renrenBrower("http://www.renren.com/home","用户名","密码")
以上这篇python 实现登录网页的操作方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
python登录网页并操作_python 实现登录网页的操作方法相关推荐
- python获取接口返回值_Python+request 登录接口reponse的返回值token跨py文件的传递《二》...
主要使用场景: 一般我们在进行接口测试时,依赖登录接口后reponse中的某些返回值,因此需要将login接口单独写一个py文件,另外的py文件均可调用login的reponse返回值使用.共用登录接 ...
- python模拟登录qq账号密码_Python自动登录QQ的实现示例
这是一份来自网络的代码,经过了我的修改和验证. 首先我的运行环境是Python3.7,需要安装PyUserInput库. 直接上代码吧: #!/usr/bin/python import os imp ...
- php qq三方登录,php如何操作qq第三方登录
本文主要和大家分享php操作qq第三方登录实例代码,希望能帮助到大家. 1.首先进入connect.qq.com进行登录注册认证等相关信息 2.配置应用的回调域等相关信息(十分重要) 3.下载php版 ...
- 【Linux】Linux 记录和查看登录日和操作志|查看登录历史
目录 零.查看最近登录ip 以及历史命令执行日期 查看当前登录用户信息 一.查看日志文件 二. 脚本生成所有登录用户的操作历史 显示历史命令和时间history 零.查看最近登录ip 以及历史命令执行 ...
- python登录网页后打印_python爬虫中文网页cmd打印出错问题解决
问题描述 用python写爬虫,很多时候我们会先在cmd下先进行尝试. 运行爬虫之后,肯定的,我们想看看爬取的结果. 于是,我们print... 运气好的话,一切顺利.但这样的次数不多,更多地,我们会 ...
- python怎么登录微博并发微博_Python代码登录新浪微博并自动发微博
前言 对于很少玩微博@張行之_的我来说,微博内容少的可怜.所以本人就想:能不能写个成功程序来帮我发微博.这个程序要满足以下要求: 自动化,自动登录微博,自动发微博. 微博内容要有意义,不能是随机生成的 ...
- python获取cookie的方法_python实现登录后获取cookie并用于之后的请求
初学python接口自动化,一些经验总结,希望遇到同样问题的小伙伴能较快解决: 依据项目的实现逻辑,用户发表评论时需检测用户当前为登录状态,即校验cookie. 用户登录后在响应头里可见到Set-co ...
- python写一个自动登录脚本_Python 脚本登录交换机实现自动配置备份
Python 脚本登录交换机实现自动配置备份 一.Python脚本 ssh = paramiko.SSHClient() ssh.set_missing_host_key_policy(paramik ...
- python模拟登录爬取数据_python 模拟登录爬取淘宝数据
淘宝现在需要登录才能爬取搜索商品,首先在登录页面登录chrome F12 开发者模式抓包 登录请求 发现有一个post请求,这个就是登录的请求了,看下面的from data 登录信息 由from da ...
- python网页结构分析图_Python爬虫解析网页的4种方式 值得收藏
用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存中, ...
最新文章
- Community Server页面布局
- pve安装黑群晖直通硬盘_在Proxmox VE(PVE)安装黑群晖
- SAP 不同 ABAP 系统里同一 Customizing activity 的显示差异分析
- 安卓APP_ 布局(2) —— RelativeLayout相对布局
- 一起动手打造个人娱乐级linux
- java volatile 原子性_Java中volatile不能保证原子性的证明
- django模块导入/函数/中间件/MVC和MTV/CSRF
- 算法面试:精选微软经典的算法面试100题(第21-25题)
- 第二章 C++对C的改进和扩展
- LayaAir 定时器 Timer
- 西门子g120变频器接线图_西门子G120变频器参数设置,快速使用
- 美国密歇根州立大学计算机专业,密歇根州立大学计算机科学与工程系
- python爬虫 requests使用代理ip
- 今日金融词汇---股价复权,是什么?
- 移动用户免费领取15G流量(秒到)
- 安卓:点击空白处隐藏软键盘
- TensorFlow-similarity 学习笔记13
- 搭建DVWA出现错误:DVWA System error - config file not found.
- edg击败we视频_超神圣枪无情屠杀 EDG击败WE全取三分
- 安徽大学计算机科学与技术学院施俊,上海大学教授施俊应邀来我院做学术报告...