微信公众号内容如何获取,python教你抓包分析并保存数据
前言
今天来教大家如何使用Fiddler抓包工具,获取公众号(PC客户端)的数据。
Fiddler是位于客户端和服务器端的HTTP代理,是目前最常用的http抓包工具之一。
环境准备
- python 3.8 运行代码
- pycharm 2021.2 辅助敲代码
- requests 第三方模块
- Fiddler 汉化版 抓包的工具
- 微信PC端
如何抓包
配置Fiddler环境
先打开Fiddler,选择工具,再选选项
在选项窗口里点击HTTPS,把勾选框都勾选上
在选项窗口里点击链接,把勾选框都勾选上,然后点击确定即可
我们还需要在客户端把网络代理开启
地址:127.0.0.1
端口:8888
抓包
先登录,然后清空Fiddler里的数据,在选到你想要的公众号内容
出现数据包后,点开,再选择Raw,里面的就是请求的具体信息
实现代码【源码 点击文末名片领取】
先访问到列表页,获取所有的详情页链接
请求头
headers = {'Host': 'mp.weixin.qq.com','Connection': 'keep-alive','User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36 NetType/WIFI MicroMessenger/7.0.20.1781(0x6700143B) WindowsWechat(0x63090016)','X-Requested-With': 'XMLHttpRequest','Accept': '*/*','Cookie': '','Sec-Fetch-Site': 'same-origin','Sec-Fetch-Mode': 'cors','Sec-Fetch-Dest': 'empty','Referer': 'https://m','Accept-Encoding': 'gzip, deflate, br','Accept-Language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
}
发送请求
690643772 ### 源码领取
url = f'https://com/mp/profile_ext?action=getmsg&__biz=Mzg3Nzc2OTQzOA==&f=json&offset=10&count=10&is_ok=1&scene=&uin=MjQwODIxNTMyMw%3D%3D&key=3e8646dd303f109219f39517773e368d92e1975e6972ccf5d1479758d37ecec3e55bc3cb1bb5606d79ec76073ab58e4019ee720c31c2b36fafa9fe891e7afb1e22809e5db3cd8890ab35a570ffb680d16617ac3049d6627e61ffdf3305e4575666e30ad80a57b14555aa6c5a3a0fb0001a6d5d2cd76fd8af116a086ce9ef2c8e&pass_ticket=f85UL5Wi11%2BmqpsvuW%2BgLUECYkDoL2apJ045mJw9lzjmzvDbqI6V6Y%2FkXeYCZ7WsuMSqko7EWesSKLrDKnJ96A%3D%3D&wxtoken=&appmsg_token=1200_VUCOfHI2jYSEziPbaYFlHoaB7977BJYsAb5cvQ~~&x5=0&f=json'
response = requests.get(url=url, headers=headers, verify=False)
解析
general_msg = response.json()['general_msg_list']
general_msg_list = json.loads(general_msg)
for general in general_msg_list['list']:content_url = general['app_msg_ext_info']['content_url']print(content_url)
再访问所有详情页链接,获取需要的图片内容
发送请求
html_data = requests.get(url=content_url, headers=headers, verify=False).text
解析数据
img_list = re.findall('<img class=".*?data-src="(.*?)"', html_data)
print(img_list)
保存数据
for img in img_list:690643772 ### 源码领取img_data = requests.get(url=img, verify=False).contentopen(f'img/{index}.jpg', mode='wb').write(img_data)index += 1
最后
文章分享到这就结束了,大家可以自行练练手,有什么问题可以评论区留言,或者点击文末名片进行学习交流
微信公众号内容如何获取,python教你抓包分析并保存数据相关推荐
- 微信公众号第三方平台开发PYTHON教程 PART 2
github地址:cppfun@wechat-open-third-party-dev 微信公众号第三方平台开发python教程 Part 1 这一节肯定是在第一节的基础上,如果你没有看过第一节,可能 ...
- requests利用selenium,代理Ip,云打码,验证码抠图操作 爬取搜狗微信公众号内容
爬取思路,爬取搜狗微信公众号内容,爬取第一层url时请求太快出现验证码,我这里用的蘑菇云代理,并在程序中我判断什么情况下是否+代理,做到合理运用代理ip.爬取第二层url时验证码出现次数更严重(和第一 ...
- 微信公众号,JS-SDK获取位置信息,并调起第三方地图App导航
微信公众号关联网页获取位置信息,可以参照<微信公众平台技术文档>-> 微信JS-SDK说明文档,官方链接地址:https://mp.weixin.qq.com/wiki?t=reso ...
- 如何编辑微信公众号(微信公众号内容制作流程)
如何编辑微信公众号(微信公众号内容制作流程) 一.关于申请事项的常见问题概述 1 .注册要花钱吗? 微信官方账号注册完全免费. 微信官方账号唯一需要交钱的地方就是年度认证费.作为个人账户,目前没有认证 ...
- 搜索引擎可搜到微信公众号内容?百度回应:不能
10月22日消息,围绕今日"微信公众号内容可被谷歌等搜索引擎搜索"的报道,百度方面向21世纪经济报道记者回应称,百度尚不能检索到微信公众号内容. 今日早些时候,有媒体报道称,在谷歌 ...
- 企业微信公众号内容写什么好?微信公众号如何选题?
企业微信公众号内容写什么好?很多时候点开微信号内容写作界面的时候是不是常常盯着写字键盘不值当从哪里下手?苦思冥想很久不知道应该设定文案的选题.别着急,伯乐网络传媒今天就来给你分享一些公众号选题小技巧. ...
- 微信公众号开发 - token获取(保证同一时间段内只请求一次)
微信公众号开发文章目录 1.微信公众号开发 - 环境搭建 2.微信公众号开发 - 配置表设计以及接入公众号接口开发 3.微信公众号开发 - token获取(保证同一时间段内只请求一次) 4.微信公众号 ...
- 在微信公众号中写html代码吗,微信公众号内容如何利用html编辑?
微信公众号内容如何利用html编辑?以下是小编整理的怎么利用html代码去更换微信公众号里的内容,有需要的朋友们请往下看具体怎么去操作的.以下内容供大家参考. 登录微信公众号 点击左侧分类的" ...
- 微信公众号微信搜索好物和服务器,你一定不知道还可以用这样的方法阅读微信公众号内容...
搜索 通过搜狗微信公众平台搜索,可以搜索微信或是公众号内容.也就是说,如果你想了解公众号上关于某个关键词都有些什么内容,用这个方法就可以找到: 订阅 有人习惯用RSS订阅网上的内容,可是微信并未提供这 ...
最新文章
- makefile变量赋值
- html标签 marquee 滚动
- MySQL BIT、BINARY、VARBINARY、BLOB(二进制类型)
- 35所大学获批新增「人工智能」本科专业,工学学位、四年制
- 小结三种控制路由发布的方法
- wpf 加载page后启动_App启动之Dyld在做什么
- 素拓活动策划书的撰写范文
- iOS 更新日志 - 持续更新中
- 数竞党必看!数学竞赛权威赛事大合集,先马后看
- div 左中右结构布局问题
- Android FrameLayout的:layout_marginTop属性失效的问题
- 51单片机控制的数字温度计 PROTEUS 和51单片机教程
- Java版1-50内素数(质数)和
- 四少女火爆外网!ControlNet组合拳效果惊人,颠覆AI绘画游戏规则
- 谷歌浏览器怎么调试js
- 我们平时常见的SEO百度关键词排名方法
- Trait 是什么?
- 用 WPF 写的颜色拾取器
- 实用记账小技巧,将账目数据导出表格的方法
- Doris系列之动态分区操作
热门文章
- 我的世界服务器修改末地难度,我的世界|带你解锁进入末地的高难度姿势
- 前端项目实战86-ant design table合并单元格
- 论取经途中孙悟空为什么屡战屡败之真正原因(转贴)
- 关于网络行为管理系统的知识点介绍
- 最好用的英语学习APP,无广告,永久免费!神仙APP! 拒绝拖延 !
- 连接VPN后无法上网 Windows Route 轻松解决
- 入门级降噪蓝牙耳机怎么选?四款入门级降噪蓝牙耳机推荐
- 获取两个时间区间季度Q半年H年Y
- linux 文件夹 乱码,linux中文文件名乱码解决
- MIT6.824 Primary-Backup Replication论文导读