最近迷上了用python写爬虫,一发不可收拾,下面我们来说一下如何实现模拟登录微信公众号平台。
故事起因,由于本人注册了一个公众号,想着如何通过脚本实现像部分用户发送消息呢? 如何实现一键上传材料呢?本来想着激活了开发者模式什么都提供了,结果万万没想到什么都没有。不放弃的我想着既然再公众号平台能做的事,我为啥不能通过爬虫来模拟登录,然后做一系列的操作。那么开始开始今天操作-模拟登录公众号平台。

  模拟实属不易,中间也遇到一些问题,但是不放弃的我终于将这关抗过来了,那么我们迎接今天的主角 微信公众号平台 https://mp.weixin.qq.com

  • 工具:Fiddler Google 浏览器
  • 语言:python

不管模拟什么,都需要经过登录页
输入账号密码,点击登录我们通过 Fiddler 工具注意了两个比较特殊的接口:

  1. 地址:https://mp.weixin.qq.com/cgi-bin/bizlogin?action=startlogin
  2. 参数:
    username= xxxxxxxxxxx 账号
    pwd=xxxxxxxxxxxxxxxxxxx 通过MD5 加密后的字符串
    imgcode= 验证码 ,后续如果登录频繁可能会触发验证码,我目前没遇到过输入验证码的情况,但是可能别人会遇到,下面我会把获取验证码的接口列出来
    f=json&userlang=zh_CN&redirect_url=&token=&lang=zh_CN&ajax=1 后面这些不是主角就不一一说了
  3. 返回值:{“base_resp”:{“err_msg”:“ok”,“ret”:0},“redirect_url”:"/cgi-bin/bizlogin?action=validate&lang=zh_CN&account=1379960679%40qq.com"}
    返回了一个重定向的地址,就是上图的第二个接口 https://mp.weixin.qq.com/cgi-bin/bizlogin?action=validate&lang=zh_CN&account=1379960679%40qq.com&token=
    通过上述输入账号密码登录后,来到了一个扫描的阶段,通过扫描二次确定增加了一定的安全性,也增加了我爬取的难度,不管什么你要扫二维码那我就把二维码下载下来,本地扫描嘛,二维码扫描这关避免不了的,如果有那位大神能越过扫描二维码这步,请收下我的膝盖,大神带带我。那么我们开始第二步

下载二维码,本地扫描

从图中标记的两个接口很清楚的知道它们的作用:

  • 接口1: https://mp.weixin.qq.com/cgi-bin/loginqrcode?action=getqrcode&param=4300&rd=483
    这个是获取二维码接口,一开始我以为rd这个参数是通过上述接口获取的值,但是发现每次刷新这个值都会变,那么就肯定不是服务器传过来的值,因为没发现有接口去服务器调用返回这个值。那个我大概猜测是个随机数,后面通过测试应该就是一个随机数,这个参数可选
  • 接口2:https://mp.weixin.qq.com/cgi-bin/loginqrcode?action=ask&token=&lang=zh_CN&f=json&ajax=1
    接口2:通过工具发现这个接口每隔一秒就调用一次向服务器询问,是否已经通过扫描二维码登录?如果已经正确扫描过,状态就返回为1


扫描成功后,我们就跳到了管理页面,我们模拟登录的过程就结束了。通过上述接口我们获取token,后续将使用token进行一系列的操作

  • 接口: https://mp.weixin.qq.com/cgi-bin/bizlogin?action=login
  • 参数:userlang=zh_CN&redirect_url=&token=&lang=zh_CN&f=json&ajax=1
  • 返回值: {“base_resp”:{“err_msg”:“ok”,“ret”:0},“redirect_url”:"/cgi-bin/home?t=home/index&lang=zh_CN&token=1502993366"} 获取正则表达式获取token

讲完了模拟登录的过程,接下来我们通过代码实现

首先:我们初始化参数:

    def __init__(self):self.session = requests.session()self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.80 Safari/537.36','Referer': 'https://mp.weixin.qq.com/'}self.QRImgPath = os.path.split(os.path.realpath(__file__))[0] + os.sep + 'webWeixinQr.jpg'self.username = "账号"self.password = "密码."

账号密码登录

    def weixin_login(self):url = "https://mp.weixin.qq.com/cgi-bin/bizlogin?action=startlogin"params = {'username': self.username,'pwd': CommonUtil.md5(self.password),'imgcode': '','f': 'json'}response = self.session.post(url, data=params, headers=self.headers, verify=False)if response.status_code == 200:target = response.content.decode('utf-8')print(target)self.get_weixin_login_qrcode()

下载二维码

    def get_weixin_login_qrcode(self):url = "https://mp.weixin.qq.com/cgi-bin/loginqrcode?action=getqrcode&param=4300"response = self.session.get(url, headers=self.headers, verify=False)with open(self.QRImgPath, 'wb') as f:f.write(response.content)f.close()# 打开二维码if sys.platform.find('darwin') >= 0:os.subprocess.call(['open', self.QRImgPath])  # 苹果系统elif sys.platform.find('linux') >= 0:os.subprocess.call(['xdg-open', self.QRImgPath])  # linux系统else:os.startfile(self.QRImgPath)  # windows系统print('请使用微信扫描二维码登录')

检查是否成功扫描二维码登录,通过开启一个子线程,每隔10秒去调用一次,如果状态返回成功就调用最终的登录接口

    def check_login(self):while True:    url = "https://mp.weixin.qq.com/cgi-bin/loginqrcode?action=ask&token=&lang=zh_CN&f=json&ajax=1"response = self.session.get(url, headers=self.headers, verify=False)json = jsons.loads(response.text)if json["status"] == 1:self.login()breaktime.sleep(10)

最终的登录接口获取token

    def login(self):url = "https://mp.weixin.qq.com/cgi-bin/bizlogin?action=login"data = {'f': 'json','ajax': 1,'random': random.random()}response = self.session.post(url, data=data, headers=self.headers, verify=False)# {"base_resp":{"err_msg":"ok","ret":0},"redirect_url":"/cgi-bin/home?t=home/index&lang=zh_CN&token=1502993366"}json = jsons.loads(response.text)redirect_url = json["redirect_url"]self.token = redirect_url[redirect_url.rfind("=") + 1:len(redirect_url)]

主方法

if __name__ == '__main__':wechat = WechatLogin()wechat.weixin_login()_thread.start_new_thread(wechat.check_login(), ("Thread-1", 2,))

完成模拟登录,获取了token,后续就可以实现 上传素材,给用户发送消息,群发等一系列的功能,今天就写到这里,源码我已经上传到 github 有问题就 提Issues 谢谢大家的支持

python 模拟登录公众号平台,主动推消息等一系列操作相关推荐

  1. Python 爬取公众号文章链接并生成html

    微信不提供公众号分组管理,部分公众号内容优质但更新频率低,我们通过抓取特定公众号更新解决这个问题. 网上介绍的方法较多,参考各位大神的文章后,最后选择了通过公众号管理平台抓取的方法. 大体思路: 通过 ...

  2. 公众号平台域名配置规则

    配置: //路径:公众平台:设置->公众号设置->功能设置 首先,登录公众号平台把xxx.txt文件放到,前端代码文件夹(服务器): //serve.com.cn或者ok_mobile.b ...

  3. 微信公众平人数多服务器会崩溃吗,微信公众号平台推新功能 再也不怕文章崩溃...

    昨日微信公众平台进行了相关更新,现在平台上的所有帐号都可以在图文编辑查看图文历史版本.这一改动为公众号运营者带来了极大的便利,在多人同时操作.多个电脑同时浏览时,再也不用担心素材内容一刷新就没了.不过 ...

  4. 用python爬取公众号推送图片并保存为PPT

    文章目录 一.前言 二.开始 (一)获取推送URL链接 (二)爬取网页并提取图片保存 1.定义用于爬取推送图片的PictureSpider类 2.定义get_url_text()方法 3.定义sear ...

  5. 通过python实现企业微信公众号链接+图文推送

    背景:通过python实现企业微信公众号链接+图文推送 目的:实现点击即看到内容,用更符合用户查看公众号消息的习惯推送消息 步骤: 1.创建企业微信公众号(应用) 2.确定推送内容(BI报表链接)+标 ...

  6. 基于python的公众号课堂教学_基于Python的微信公众号数据挖掘分析

    基于Python的微信公众号数据挖掘分析 华南农业大学电子工程学院 王 建 黄宁香 [期刊名称]电子世界 [年(卷),期]2019(000)011 [总页数]3 运用Python网络爬虫技术对某时事类 ...

  7. python爬取公众号阅读量_如何快速、高效的爬取微信公众号阅读、在看数呢?

    ​自从2013年,自媒体开始崛起.再到2014年,自媒体开始能够赚钱,自媒体逐渐成为这个时代的一个趋势性的潮流. 随着公众号平台的不断火爆,各个自媒体平台如春笋班拔地而起.自媒体的蓬勃发展,很大程度上 ...

  8. python爬取公众号阅读量_Python爬虫实践:如何快速、高效的爬取微信公众号阅读在看数...

    自从2013年,自媒体开始崛起.再到2014年,自媒体开始能够赚钱,自媒体逐渐成为这个时代的一个趋势性的潮流. 随着公众号平台的不断火爆,各个自媒体平台如春笋班拔地而起.自媒体的蓬勃发展,很大程度上重 ...

  9. Python模拟登录详细教程!

    这个我是先在我的公众号上发的,所以,可以点击下面这个链接访问我之前做好的公众号推文吧! 公众号推文,点击访问.先看这个文章,再看我写的改进版啊!!!! 下面就展示下,我根据之前在公众号上的推文,改良版 ...

最新文章

  1. 前沿分享:连接统计学,机器学习与自动推理的新兴交叉领域
  2. 《Linux菜鸟入门》Linux网络管理
  3. 循环队列(0965)
  4. apache重写规则转Nginx
  5. 你的项目刚刚启动?是时候考虑Globalization了!
  6. Dynamic CRM 2013学习笔记(三十三)自定义审批流4 - 规则节点 -有分支的流程处理...
  7. 95-910-335-源码-FlinkSQL-Calcite-FlinkSQL解析
  8. 运行报错provider = models.ForeignKey(Provider, on_delete=True) TypeError(‘on_delete must be callable.‘)
  9. 菜鸟的学习之路(9) — ArrayList类
  10. linux程序安装包怎么用,制作Linux下程序安装包——使用脚本打包bin、run等安装包...
  11. python各个版本区别_Python 的各个版本
  12. HRCAD2008 无法加载问题
  13. 论文排版 | Texworks
  14. plc secs半导体通讯协议 PLC 与MES的SECS/GEM通讯方案
  15. 宝马和戴姆勒冻结自动驾驶合作项目
  16. 树莓派使用433Mhz射频无线收发
  17. 贝叶斯 - 《贝叶斯统计》笔记
  18. 为了面试能通过,我要看完这75道面试题(下)
  19. python通过jira的接口操作jira
  20. 科大讯飞语音离线命令识别

热门文章

  1. 一个屌丝程序猿的人生(一百一十八)
  2. win10-LTSC2019装机必备操作和软件备忘录
  3. 通过Visual Studio 2019搭建DirectX 12开发环境
  4. 2016年最新苹果开发者账号注册流程详解(公司账号篇)
  5. 简单讲讲前端路由概念
  6. MySQL安装一直卡在starting server
  7. Varian OBI几个奇葩之处
  8. 【剁手】科技发烧友最爱的产品,光是看看就想剁手!
  9. ALE重新授权,简译笔记
  10. C# TSC TE244 PrintDocument 固定资产哑银不干胶标签打印