这次尝试模拟登录微博,获取com网站cookie,cn不可用。

分析网站

首先打开weibo.com微博登录页面,如果已经登录需要先退出(其他的com登录页应该也是可以的)。

打开chrome调试,查看传输状态。清除记录之后勾选 preserve log,再输入帐号,当输入完帐号鼠标点击空白之后,会触发一个js事件,如上图。打开这个请求网址之后:发现这个json字典数据包含着下一步需要用的登录表单,所以先注意一下,回头再看。

输入密码之后登录,观察数据包。login.php看名字好像就是登录的请求了。 再看看它提交的数据,sp就是密码,su就是帐号。其他的数据怎么得到呢,我们就需要找到它执行的ssologin.js了。

这个包也可以在js中找到,之后打开这个文件会看到一整片没有格式化的js代码,很头疼。可以 查找关键字 rsa2,这一块就是加密代码,很深奥有没有。这一块搞了半天最后还是google出来的.-.-.

OK,到这已经乱了。。。整理一下思路。

我们登录的步骤是:输入帐号 -> 网页返回prelogin,这个里面包含表单信息 -> 网页调用ssologin.js加密数据 -> 提交数据。

我们就需要:获得prelogin数据 -> 用python仿照ssologin.js把数据加密 -> 提交。

上代码

请求prelogin,获取所需参数。用正则表达式截取字典,用eval函数把字符串转换成字典类型,分别获取值。

prelogin_url = r'https://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=&rsakt=mod&client=ssologin.js(v1.4.15)' #noqa

def Prelogin(prelogin_url):

data = requests.get(prelogin_url).content.decode('utf-8')

p = re.compile('\((.*)\)')

data_str = p.search(data).group(1)

server_data_dict = eval(data_str)

pubkey = server_data_dict['pubkey']

servertime = server_data_dict['servertime']

nonce = server_data_dict['nonce']

rsakv = server_data_dict['rsakv']

return pubkey, servertime, nonce, rsakv

有了上面的数据就可以加密帐号密码了,帐号是由url加密,再用base64加密。密码就比较复杂了,基本按照ssologin.js来。

def RSAEncoder(username, password, pubkey, servertime, nonce):

su_url = urllib.parse.quote_plus(username)

su_encoded = su_url.encode('utf-8')

su = base64.b64encode(su_encoded)

su = su.decode('utf-8')

rsaPublickey = int(pubkey, 16)

e = int('10001', 16)

key = rsa.PublicKey(rsaPublickey, e)

message = str(servertime) + '\t' + str(nonce) + '\n' + str(password)

password = rsa.encrypt(message.encode('utf-8'), key)

sp = binascii.b2a_hex(password)

return su, sp

数据准备好了之后就能填表单了。

def PostData(username, password, pubkey, servertime, nonce, rsakv):

su, sp = RSAEncoder(username, password, pubkey, servertime, nonce)

post_data = {

'encoding': 'UTF-8',

'entry': 'weibo',

'from': '',

'gateway': '1',

'nonce': nonce,

'pagerefer': '',

'prelt': '645',

'pwencode': 'rsa2',

'returntype': 'META',

'rsakv': rsakv,

'savestate': '7',

'servertime': str(servertime),

'service': 'miniblog',

'sp': sp,

'sr': '1920*1080',

'su': su,

'url': 'http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack', #noqa

'useticket': '1',

'vsnf': '1',

}

return post_data

可以登录了。第一次请求到的网页不是登录成功的页面,而是一个重定向,如图,用正则表达式提取网址,进行访问,成功!

def login(self):

pubkey, servertime, nonce, rsakv = Prelogin(self.prelogin_url)

post_data = PostData(self.username, self.password, pubkey, servertime,

nonce, rsakv)

session = requests.Session()

response = session.post(self.login_url, params=post_data,

headers=self.headers)

text = response.content.decode('gbk')

pa = re.compile(r'location\.replace\(\'(.*?)\'\)')

redirect_url = pa.search(text).group(1)

response = session.get(redirect_url, headers=self.headers)

print(session.cookies)

python 模拟登录获取cookie_Python获取新浪微博cookie模拟登录相关推荐

  1. php新浪微博 登录接口文档,新浪微博的账号登录及PHP api操作

    新浪微博 的账号登录及api操作,使用oauth 2.0 官方提供的sdk都太过庞大,这是我自己简化的,提供简单的账号登录.获取个人信息.发布微博等功能,如果需要其他功能可以根据官方的api文档自行添 ...

  2. python爬虫模块取cookie_Python爬虫之cookie的获取、保存和使用【新手必学】

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:huhanghao Cookie,指某些网站为了辨别用户身份.进行s ...

  3. 如何HttpWebRequest模拟登陆,获取服务端返回Cookie以便登录请求后使用

    public static string GetCookie(string requestUrlString, Encoding encoding, ref CookieContainer cooki ...

  4. Python自动化测试之cookie绕过登录(保持登录状态)

    目录 前言 cookie工作原理 cookie绕过登录 1,哪些场景需要使用cookie绕过登录? 2,接下来举例说明怎样编写python脚本,利用cookie机制绕过登录. 3,思路: 4,实际操作 ...

  5. python模拟登记获取cookie_Python爬虫实战入门四:使用Cookie模拟登录——获取电子书下载链接...

    在实际情况中,很多网站的内容都是需要登录之后才能看到,如此我们就需要进行模拟登录,使用登录后的状态进行爬取.这里就需要使用到Cookie. 使用Cookie进行模拟登录 现在大多数的网站都是使用Coo ...

  6. python获取登录后的cookie_python爬虫使用cookie登录详解

    前言: 什么是cookie? Cookie,指某些网站为了辨别用户身份.进行session跟踪而储存在用户本地终端上的数据(通常经过加密). 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想 ...

  7. python模拟登录页面下载_Python爬虫实战入门四:使用Cookie模拟登录——获取电子书下载链接...

    在实际情况中,很多网站的内容都是需要登录之后才能看到,如此我们就需要进行模拟登录,使用登录后的状态进行爬取.这里就需要使用到Cookie. 现在大多数的网站都是使用Cookie跟踪用户的登录状态,一旦 ...

  8. python爬虫登录下载_Python爬虫实战入门四:使用Cookie模拟登录——获取电子书下载链接...

    在实际情况中,很多网站的内容都是需要登录之后才能看到,如此我们就需要进行模拟登录,使用登录后的状态进行爬取.这里就需要使用到Cookie. 现在大多数的网站都是使用Cookie跟踪用户的登录状态,一旦 ...

  9. python爬取qq邮箱_使用Python模拟登录QQ邮箱获取QQ好友列表

    最近因开发项目的需要,有一个需求,就是很多SNS网站都有的通过 Email地址 导入好友列表,不过这次要导入的不是Email 列表,而是QQ的好友列表. 实现方式: 通过google一搜,实现的方式大 ...

最新文章

  1. java的关键字和保留字_「Java」详解常见的53个关键字
  2. python手机版安卓-用Python实现自动化操作Android手机
  3. Linux系统下常用rpm包搜索网站
  4. fwrite函数的一般调用形式是什么?
  5. C++ 流的操作 | 初识IO类、文件流、string流的使用
  6. 【IT】一些有用的链接和操作
  7. 【JVM】上帝视角看JVM内存模型,分而治之论各模块详情
  8. ラブ・ストーリーは突然に(突然發生的愛情故事)歌詞
  9. 公开标准不赚钱,认证赚大钱
  10. 新建一个grub软盘镜像
  11. 放映机服务器型号,巴可Barco SP4K-20CS4激光系列智能影院放映机投影机
  12. Android Studio Emulator 报错 detected adb
  13. SDOI2018 一轮培训划水祭
  14. React移动端端局域网手机访问测试
  15. UNITY与Mac⭐一、在苹果电脑上配置 Unity 安卓环境的教程
  16. 中科院博士论文致谢部分走红,感动无数网友,其实沉下心来,你我何尝不是前程万里
  17. vux scroller在iOS13上,一停止滑动就跳到顶部
  18. dedecms联动筛选_织梦dedecms联动筛选[伪静态版]
  19. Kinect动作捕捉的改进
  20. html标签可以嵌套吗,HTML标签的嵌套

热门文章

  1. iOS 自动生成各种尺寸的App Icon 和 Launch Image( App Icon Gear)
  2. 智能硬件产品盈利模式
  3. 【JAVA】贪吃蛇的初步实现(一)
  4. 防止学生机退出电子教室软件的方法
  5. 光纤中的多种光学模式芯径_单模光纤和多模光纤的区别特点?选择哪个好?
  6. 自动驾驶汽车如何识别红绿灯?三个角度告诉你答案丨曼孚科技
  7. 字节跳动推出在线医疗App“小荷” 品牌域名或要另辟蹊径?
  8. 将数组以逗号拼接_javascript将数组拼接成一个字符串
  9. I-SVM SVM增量学习
  10. vue导入处理Excel表格详解