Python 模拟微博登陆,亲测有效!
今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……
代码是参考了:https://www.douban.com/note/201767245/,我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习。
PC 登录新浪微博时, 在客户端用JS预先对用户名、密码都进行了加密,而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。这样,就不能用通常的那种简单方法来模拟POST 登录( 比如人人网 )。
在提交POST请求之前,需要GET 获取两个参数。地址是:http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.3.18)。
得到的数据中有 servertime 和 nonce 的值, 是随机的,其他值貌似没什么用。
def get_servertime(): url = 'http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=dW5kZWZpbmVk&client=ssologin.js(v1.3.18)&_=1329806375939' # 返回出来的是一个Response对象,无法直接获取,text后,可以通过正则匹配到 # 大概长这样子的:sinaSSOController.preloginCallBack({"retcode":0,"servertime":1545606770, ...}) data = requests.request('GET', url).text p = re.compile('\((.*)\)') try: json_data = p.search(data).group(1) data = json.loads(json_data) servertime = str(data['servertime']) nonce = data['nonce'] return servertime, nonce except: print('获取 severtime 失败!') return None
通过 httpfox 观察 POST 的数据,参数较复杂,其中“su" 是加密后的username, sp 是加密后的password,servertime 和 nonce 是上一步得到的,其他参数是不变的。
username 经过了 BASE64 计算:
username = base64.encodestring( urllib.quote(username) )[:-1]
password 经过了三次SHA1 加密,且其中加入了 servertime 和 nonce 的值来干扰。即:两次SHA1加密后,将结果加上 servertime 和 nonce 的值,再SHA1 算一次。
def get_pwd(pwd, servertime, nonce): # 第一次计算,注意Python3 的加密需要encode,使用bytes pwd1 = hashlib.sha1(pwd.encode()).hexdigest() # 使用pwd1的结果在计算第二次 pwd2 = hashlib.sha1(pwd1.encode()).hexdigest() # 使用第二次的结果再加上之前计算好的servertime和nonce值,hash一次 pwd3_ = pwd2 + servertime + nonce pwd3 = hashlib.sha1(pwd3_.encode()).hexdigest() return pwd3
def get_user(username): # 将@符号转换成url中能够识别的字符 _username = urllib.request.quote(username) # Python3中的base64计算也是要字节 # base64出来后,最后有一个换行符,所以用了切片去了最后一个字符 username = base64.encodebytes(_username.encode())[:-1] return username
将参数组织好,POST请求。这之后还没有登录成功,POST后得到的内容中包含一句:
location.replace("http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&retcode=101&reason=%B5%C7%C2%BC%C3%FB%BB%F2%C3%DC%C2%EB%B4%ED%CE%F3")
这是登录失败时的结果,登录成功后结果与之类似,不过 retcode 的值是0。接下来再请求这个URL,这样就成功登录到微博了。记得要提前build 缓存。
作者简介:上海小胖,四大咨询的Tech Lead,MongoDB Professional获得者。「Python专栏」专注Python领域的各种技术:爬虫、DevOps、人工智能、Web开发等。还有「大航海计划」,各种内推活动。
声明:本文为作者投稿,版权归其个人所有。
热 文 推 荐
☞ 「傻瓜」才能写出好代码!
☞ 漫画 | 从搬家到容器技术 Docker 应用场景解析
☞ Hacker News 12 月招聘趋势:React 已连续霸榜 19 个月
☞ 从倾家荡产到身价百亿,这个85后只用了8年
☞ 难逃寒冬裁员的“大追杀”,30 岁女码农该何去何从?
☞ OpenStack 2018 年终盘点
拼多多黄峥给陆奇“兼职”,欲挖掘这类AI人才
☞ 老程序员肺腑忠告:千万别一辈子靠技术生存!
print_r('点个好看吧!');
var_dump('点个好看吧!');
NSLog(@"点个好看吧!");
System.out.println("点个好看吧!");
console.log("点个好看吧!");
print("点个好看吧!");
printf("点个好看吧!\n");
cout << "点个好看吧!" << endl;
Console.WriteLine("点个好看吧!");
fmt.Println("点个好看吧!");
Response.Write("点个好看吧!");
alert("点个好看吧!")
echo "点个好看吧!"
点击“阅读原文”,打开 CSDN App 阅读更贴心!
喜欢就点击“好看”吧!
Python 模拟微博登陆,亲测有效!相关推荐
- Python模拟微博登陆,亲测有效!
作者 l 上海小胖 来源 l Python专栏(ID:xpchuiit) 转载请联系授权(微信ID:pythonzhuanlan) 今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密.那么首先就 ...
- python模拟微博登陆之验证码自动处理
前言: 之前玩过微博爬虫,可以实现验证码的自动解锁和账号自动登录,最近朋友说也想玩玩微博,问我要代码,运行后发现无法自动登录, 之前的代码用的是九茶大神的, 搜了发现他没有更新,看很多网友也在求解决方 ...
- java模拟微博登录_Python模拟微博登陆,亲测有效
今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密.那么首先就要做那件必做之事!模拟登陆-- 我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习. PC 登录 ...
- 微博登录设备有python_Python模拟微博登陆,亲测有效
今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密.那么首先就要做那件必做之事!模拟登陆-- 我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习. PC 登录 ...
- python英文聊天机器人(亲测可用)
python英文聊天机器人(亲测可用) 本文参考https://www.cnblogs.com/youcong/p/10462924.html 第一步: 下载所需包 pip install aiml ...
- php微博cookie获取,python模拟新浪微博登陆之获取cookies-Go语言中文社区
首先感谢敲代码的耗子,之前一直搞不懂登陆新浪微博的原理,看了他那篇文章之后,终于明白了基本原理.在这里主要是通过代码实现那篇文章的过程. 获取网页使用的包是requests,正则匹配用的是re,其他需 ...
- Python爬虫:(亲测,已解决!)解决在使用谷歌浏览器的开发者工具时,没有Referer防盗链缺失问题。
今天,我在做Python网络爬虫时(web spider),正在爬取哔哩哔哩的某一个视频,发现一个致命问题,就是单纯在headers中加入UA(user-Agent)是不够的,也就是说,我的爬虫没有足 ...
- python繁简体转换【亲测有效】
背景:工作中需要将一些繁体字转成简体字,发现python的opencc-python模块可以做到,做下笔记,希望能帮助有同样问题的旁友~ 模块简介:OpenCC-Python是一个致力于中文简繁转换的 ...
- Python生成.exe文件亲测实践教程(初级+进阶,含资源文件程序的打包)
使用打包工具PyInstaller的基础操作: 此部分包括安装模块+模块的常见指令的使用 具体流程可以参考以下两篇文章非常详细 (9条消息) Python如何生成可执行的.exe文件_zhaochon ...
最新文章
- Webpack系列-第一篇基础杂记
- pandas版本_Datawhale十二月Pandas组学习打卡Task00.准备工作
- main 函数的标准原型
- 谁动了我的奶酪?--java实例初始化的顺序问题
- 【数据结构与算法】布谷鸟散列表的Java实现
- DNN: ModuleSettings Vs TabModuleSettings
- CleanMyMac X2021专业苹果电脑系统优化工具
- Dell笔记本Alienware Command Center监测不到CPU和内存数据
- 鹏业安装算量软件合并计算项目操作
- java制作oa审批流程,传智播客JAVA培训OA项目 审批流转模块
- 单片机中的数据存储器ram
- 微信公众号数据2019_历史微信公众号排名,微信公众号新榜排名
- Helm 创建一个NOTES.txt文件
- html制作windows 10,Windows 10迎来Alpha版HTML编辑器应用
- 【MySQL】MySQL的自然连接和USING连接详细总结
- CSS中 *{ }、*zoom,各种 * 代表的意思
- Python实现按键精灵功能
- Locust使用手册--开始使用Locust
- 学习笔记 | 深度森林 Deep Forest
- [WinForm] 获取 Resources 资源文件里里指定类型的数据列表
热门文章
- server接收dtu透传代码_Swoole学习笔记二:初探server与client(Client同步)
- opencv-python 鼠标事件和坐标点截图
- 单词压缩编码--Trie树
- Boost.Asio的网络编程
- SQL数据库实战之查找当前薪水详情以及部门编号dept_no
- Linux生成子进程函数fork()
- 中国替扎尼定行业市场供需与战略研究报告
- 电工结业试卷_电工学试题.doc
- 自由软件之父回归 FSF,遭 1933 人、21 家组织联名抵制!
- 腾讯否认微信测试语音消息进度调节​;监证会同意蚂蚁集团科创板IPO注册;React 17 正式版发布|极客头条