> 本文首发自公众号:python3xxx

爬取公众号的方式常见的有两种

- 通过搜狗搜索去获取,缺点是只能获取最新的十条推送文章

- 通过微信公众号的素材管理,获取公众号文章。缺点是需要申请自己的公众号。

![图片描述](//img.mukewang.com/5d21747100010b7908030482.jpg)

今天介绍一种通过抓包PC端微信的方式去获取公众号文章的方法。相比其他的方法非常方便。

![图片描述](//img.mukewang.com/5d2174810001c39110500389.jpg)

![图片描述](//img.mukewang.com/5d2174910001a5b310800452.jpg)

如上图,通过抓包工具获取微信的网络信息请求,我们发现每次下拉刷新文章的时候都会请求 mp.weixin.qq.com/mp/profile_ext 这个接口。

经过多次测试分析,用到了以下几个参数

- __biz : 用户和公众号之间的唯一id,

- uin :用户的私密id

- key :请求的秘钥,一段时候只会就会失效。

- offset :偏移量

- count :每次请求的条数

数据如下

```

{

"ret": 0,

"errmsg": "ok", # 请求状态

"msg_count": 10, # 信息条数

"can_msg_continue": 1, # 是否还可以继续获取,1代表可以。0代表不可以,也就是最后一页

"general_msg_list": "{"list":[]}", # 公众号文本信息

"next_offset": 20,

"video_count": 1,

"use_video_tab": 1,

"real_type": 0,

"home_page_list": []

}

```

部分代码如下

```

params = {

'__biz': biz,

'uin': uin,

'key': key,

'offset': offset,

'count': count,

'action': 'getmsg',

'f': 'json'

}

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'

}

response = requests.get(url=url, params=params, headers=headers)

resp_json = response.json()

if resp_json.get('errmsg') == 'ok':

resp_json = response.json()

# 是否还有分页数据, 用于判断return的值

can_msg_continue = resp_json['can_msg_continue']

# 当前分页文章数

msg_count = resp_json['msg_count']

general_msg_list = json.loads(resp_json['general_msg_list'])

list = general_msg_list.get('list')

print(list, "**************")

```

50行python代码自动生成文章_50行Python代码,教你获取公众号全部文章相关推荐

  1. python实现50行代码_50行Python代码,教你获取公众号全部文章

    > 本文首发自公众号:python3xxx 爬取公众号的方式常见的有两种 - 通过搜狗搜索去获取,缺点是只能获取最新的十条推送文章 - 通过微信公众号的素材管理,获取公众号文章.缺点是需要申请自 ...

  2. 50行Python代码,教你获取公众号全部文章

    点击"小詹学Python",选择"置顶或者星标" 第一时间收到精彩推送! 小詹说:我们平时阅读公众号的文章会遇到一个问题--阅读历史文章体验不好.的确如此,小詹 ...

  3. 50行python代码自动生成文章_如何通过50行Python代码获取公众号全部文章

    前言 我们平时阅读公众号的文章会遇到一个问题--阅读历史文章体验不好. 我们知道爬取公众号的方式常见的有两种:通过搜狗搜索去获取,缺点是只能获取最新的十条推送文章.通过微信公众号的素材管理,获取公众号 ...

  4. 50行Python代码,获取公众号全部文章

    作者 | 胖虎 转载自Python3X(ID: python3xxx ) 爬取公众号的方式常见的有两种: 通过搜狗搜索去获取,缺点是只能获取最新的十条推送文章. 通过微信公众号的素材管理,获取公众号文 ...

  5. python爱好者社区公众号历史文章合集_GitHub - acherie/weixin_crawler: 高效微信公众号历史文章和阅读数据爬虫powered by scrapy...

    What is weixin_crawler? weixin_crawler是一款使用Scrapy.Flask.Echarts.Elasticsearch等实现的微信公众号文章爬虫,自带分析报告和全文 ...

  6. 我是怎么保存公众号历史文章合集到本地的?当然是用python了!

    本文授权转载自:小痴印记 不知道你有没有这样的经历. 偶然间,关注了一个自己特别感兴趣的公众号,感觉就像是挖到了一个宝藏.于是,我们就想翻一翻宝藏里都有什么. 但是,如果你想看到宝藏最开始的内容,你不 ...

  7. python爬虫搜特定内容的论文_python爬取指定微信公众号文章

    python怎么抓取微信阅清晨的阳光比不上你的一缕微笑那么动人,傍晚的彩霞比不上你的一声叹息那么心疼,你的一个个举动,一句句话语都给小编带来无尽的幸福. 抓取微信公众号的文章 一.思路分析 目前所知晓 ...

  8. 通用获取公众号文章历史,阅读量接口

    1.提供获取公众号历史文章,文章阅读量等接口 2.基于windows,无需手机代理 3.一台windows服务器可以挂载15个微信 4.可根据业务需求定制化 5.wx: 13100372382

  9. python心得体会200字_50行代码让python自动生成文章

    不知道从小到大,我们被迫写了多少心得体会,多少人生感想,如果真情实地的去感受写作然后成长当然很好,但是更多的都是形式主义的需求,并没有人去看里面的内容,白白浪费我们多少大好时光,有时候我们ctrl,C ...

最新文章

  1. intellij idea 1314 插件推荐及快速上手建议 (已更新!)
  2. Delphi实例分析:远程传输数据和文件
  3. Equipment upload 不起作用的分析
  4. Cortex-M3异常
  5. 盼望的意思是什么,怎么用盼望造句?
  6. e-r 概念模型 关系模型_数据库数据模型(分类、三要素、概念)
  7. Latex Error: File ended while scanning use of \@xdblarge
  8. android viewpager监听,viewPager的OnPageChangeListener监听器的方法调用顺序
  9. 好用的文件批量改名工具推荐
  10. SOEM主站安装及简单试用记录
  11. 微信小程序的两种视频录制方式
  12. 信息学奥赛一本通(C++)版在线评测系统网址
  13. IOS开发-苹果开发者中心 提示 edit phone number
  14. 论文阅读 2021——SUNet: Symmetric Undistortion Network for Rolling Shutter Correction
  15. Shell中判断字符串是否为数字的6种方法
  16. 计算机网络习题——第3章 数据链路层
  17. 我要搬家到CSDN了,好吧
  18. 浅谈javascript的原型和原型链(新手懵懂想学会原型链?看这篇文章就足够啦!!!)
  19. CF1604B XOR Specia-LIS-t
  20. 编译原理三级项目PL/0的研究与改进

热门文章

  1. 热烈庆祝湖南众建机械登陆资本市场!
  2. 使用vtk提取模型模型边线2021-01-24
  3. Linux中sysinfo的用法
  4. Kafka淘汰倒计时!这个云原生消息中间件,腾讯、华为都用疯了?
  5. Python+Vue计算机毕业设计福州旅游网站r2qdr(源码+程序+LW+部署)
  6. 学海之无涯,而吾生之有涯
  7. c#addrange_清单 .AddRange()方法与C#中的示例
  8. Acwing66周赛+Leetcode308周赛
  9. 超级实用的javascript经典大全 js大全
  10. 蓝桥杯真题 15省7-牌型种数 小明被劫持到X赌城,被迫与其他3人玩牌。 一副扑克牌(去掉大小王牌,共52张),均匀发给4个人,每个人13张。 这时,小明脑子里突然冒出一个问题: 如果不考虑花色,