《转载》python爬虫实践之模拟登录
浏览器访问服务器的过程
Http消息
什么是Cookie?
为什么需要Cookie
Cookie的种类
Cookie的构成
python模拟登录
- #! /usr/bin/env python
- #coding:utf-8
- import sys
- import re
- import urllib2
- import urllib
- import requests
- import cookielib
- ## 这段代码是用于解决中文报错的问题
- reload(sys)
- sys.setdefaultencoding("utf8")
- #####################################################
- #登录人人
- loginurl = 'http://www.renren.com/PLogin.do'
- logindomain = 'renren.com'
- class Login(object):
- def __init__(self):
- self.name = ''
- self.passwprd = ''
- self.domain = ''
- self.cj = cookielib.LWPCookieJar()
- self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cj))
- urllib2.install_opener(self.opener)
- def setLoginInfo(self,username,password,domain):
- '''''设置用户登录信息'''
- self.name = username
- self.pwd = password
- self.domain = domain
- def login(self):
- '''''登录网站'''
- loginparams = {'domain':self.domain,'email':self.name, 'password':self.pwd}
- headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.57 Safari/537.36'}
- req = urllib2.Request(loginurl, urllib.urlencode(loginparams),headers=headers)
- response = urllib2.urlopen(req)
- self.operate = self.opener.open(req)
- thePage = response.read()
- if __name__ == '__main__':
- userlogin = Login()
- username = 'username'
- password = 'password'
- domain = logindomain
- userlogin.setLoginInfo(username,password,domain)
- userlogin.login()
转载于:https://www.cnblogs.com/abc8023/p/8669786.html
《转载》python爬虫实践之模拟登录相关推荐
- Python 爬虫实战5 模拟登录淘宝并获取所有订单
经过多次尝试,模拟登录淘宝终于成功了,实在是不容易,淘宝的登录加密和验证太复杂了,煞费苦心,在此写出来和大家一起分享,希望大家支持. 本篇内容 python模拟登录淘宝网页 获取登录用户的所有订单详情 ...
- python爬虫实现豆瓣模拟登录
这是豆瓣登录界面URL https://www.douban.com/accounts/login 用pychrm编写爬虫代码 import requests url = 'https://www.d ...
- python爬虫(四)——模拟登录丁香园
实战 实战小项目:模拟登录丁香园,抓取论坛页面人员基本信息与回复帖子.丁香园论坛:http://www.dxy.cn/bbs/thread/626626#626626 思路 首先把登陆方式由扫码切换为 ...
- python爬虫4.1模拟登录古诗词网并通过Cookie处理获取个人信息
1.前言 好久没有写过笔记了....本来这节内容是模拟登录人人网,但是人人网现在无法注册了...就换了家网站.这个代码是可以模拟登录古诗词网,进入登录成功后跳转的页面后,再进入个人收藏界面,获取个人收 ...
- Python爬虫实战:模拟登录淘宝网站
前言 在完成爬虫任务的时候,我们总是会遇到用户账号登陆的问题,如果自己手动登陆的话,那么工作量就很大了,如何解决登陆问题呢? 今天老师带领大家使用selenium完成淘宝账号登陆 本篇文章知识点: s ...
- python爬虫学习之模拟登录淘宝
使用教程 下载chrome浏览器 查看chrome浏览器的版本号,对应版本号的chromedriver驱动 pip安装下列包 pip install selenium 登录微博,并通过微博绑定淘宝账号 ...
- 【Python爬虫】:模拟登录QQ空间
观察了下QQ空间实在是太好登录了!只需要首先点击账号密码登录,然后输入你的账号和密码就可以了! 其中需要注意的是; 1.进行第一次点击的时候,点击"账号密码"的时候,需要首先切换到 ...
- Python爬虫实践-网易云音乐
1.前言 最近,网易的音乐很多听不到了,刚好也看到很多教程,跟进学习了一下,也集大全了吧,本来想优化一下的,但是发现问题还是有点复杂,最后另辟捷径,提供了简单的方法啊! 本文主要参考 python编写 ...
- Python 爬虫实战,模拟登陆爬取数据
Python 爬虫实战,模拟登陆爬取数据 从0记录爬取某网站上的资源连接: 模拟登陆 爬取数据 保存到本地 结果演示: 源网站展示: 爬到的本地文件展示: 环境准备: python环境安装 略 安装r ...
- python爬虫初学实战——免登录爬取easyicon里的vip图标(2)
python爬虫初学实战-免登录爬取easyicon里的vip图标(2) 实验日期:2020-08-09 tips:没看过前面(1)的可以康康,指路 -> 爬取easyicon里的png图标 成 ...
最新文章
- SCCM 2012 R2---安装SCCM 2012 R2
- fastjson将json字符串转为Map对象,拿走不谢
- 010_JMS消息选择器
- Keil编译报错:Cannot open include file: 'stdbool.h': No such file or directory问题解决
- 一分钟理清Mysql的锁类型——《深究Mysql锁》
- 《R数据可视化手册》一1.4 从Excel文件中加载数据
- 痞子衡嵌入式:开启NXP-MCUBootUtility工具的BEE加密功能 - image_enc
- 看动画轻松理解时间复杂度(一)
- Elasticsearch 自定义分析器Analyzer
- mysql取消外键限制_mysql怎么取消外键限制(约束)?
- linux系统管理学习笔记之八---linux文件与目录的管理及权限
- 什么是挂载?mount的用处在哪?
- Exchange 2013CU17和office 365混合部署-配置SSO(七)
- cad电气工程量计算机,CAD电气管线快速算量方法
- 无线通信设备安装工程概预算编制_安装造价工程 电气安装预算编制
- matlab画图plot以及自动保存图像
- FastDB 磁盘和无盘模式
- -XX:MaxDirectMemorySize直接内存无效问题
- 微信公众号服务器搭建
- 【干货】Kaggle数据挖掘比赛经验分享,陈成龙博士整理!
热门文章
- BT.601与BT.656
- 国外免费服务器 win系统,FreeSSHd一个免费的SSH服务器的Windows | MOS86
- 计算机科学素养大赛,第六届全国大学生计算机应用能力与信息素养大赛圆满结束...
- Unknown initial character set index ‘255‘ received from server.
- C语言:计算1*2*3*....*100,即求100!。
- 计算机电竞方向,关于电竞专业的就业方向
- 享元模式在 Java Integer 中的应用
- 神经网络全连接层详解
- c#文件分割与合并 part 1 (转自互联网)
- Nginx1.10编译安装