本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。

前言

对于抓取微信公众号文章主要通过代理ip抓包进行的操作,总会出现一些问题,以下问题导致无法抓包。

解决方案

微信账号无法抓包问题:

{'ret': -6, 'errmsg': 'unknownerror', 'home_page_list': []}

对于微信账号无法抓包问题,主要出现在python请求代码的问题。

当我们所get所返回到的响应内容出现'msg_count':0值时,代表当前页面所获取的文章为零,这时如果没有停止get请求,即一直发送get请求;

在发送一定次数时就会出现{'ret':-6, 'errmsg': 'unknown error', 'home_page_list': []}响应,get不到我们想要得到的数据。

我们这时会发现如果再用该微信账号去抓取其它的公众号get就会直接返回{'ret': -6, 'errmsg': 'unknown error', 'home_page_list': []}响应,猜测:此时账号被服务器识别,无法返回响应。当换了一个微信账号时,成功返回并抓到了响应的数据。故得出结论:当我们在返回值中出现'msg_count':0时,未终止程序,继续get就会出现账号无法抓取数据包的情况,期限是1天,1天后即可继续抓取。

请求发送过快</

Python实现抓取微信公众号文章相关推荐

  1. python爬虫抓取微信公众号文章(含全文图以及点赞数、在看数、阅读数)

    因工作需要写了一个微信公众号文章的爬虫程序,贴一下分享给需要的朋友. 首先是抓取文章的url链接,在反复研究之后找到的一个最简单的方法,不需要抓包工具.首先需要自己注册一个微信公众号,有微信即可绑定注 ...

  2. Python轻松抓取微信公众号文章

    今天继续向 Python 头条添加数据信息,完成了微信公号的爬虫,接下来会继续通过搜狗的知乎搜索抓取知乎上与 Python 相关的文章.问答.微信公众号的文章链接有些是具有时效性的,过一段时间会变成参 ...

  3. python公众号文章_Python 抓取微信公众号文章

    起因是刷微信的时候看到一篇文章,Python 抓取微信公众号文章保存成pdf,很容易搜到,就不贴出来了 先用chrome登陆微信公众号后台,先获取一下自己的cookie,复制下来就行,解析一下转换成 ...

  4. java 微信文章评论点赞_使用fiddler抓取微信公众号文章的阅读数、点赞数、评论数...

    1 设置fiddler支持https 打开fiddler,在菜单栏中依次选择 [Tools]->[Options]->[HTTPS],勾上如下图的选项: 单击Actions,选择Expor ...

  5. 记一次批量定时抓取微信公众号文章的实现

    记一次批量定时抓取微信公众号文章的实现 抓取前的说明和准备 数据的抓取 批量抓取 定时抓取 对爬虫防抓取机制的一些解决办法 最后 抓取前的说明和准备 本次抓取的选择的语言是java,本文章不会将整个工 ...

  6. python 公众号文章发布_Python 抓取微信公众号文章

    版权声明:此文章转载自 Yushneng PyHub 如需转载请联系听云College团队成员阮小乙,邮箱:ruanqy#tingyun.com 微信公众号的文章链接有些是具有时效性的,过一段时间会变 ...

  7. 利用搜狗抓取微信公众号文章

    微信一直是一个自己玩的小圈子,前段时间搜狗推出的微信搜索带来了一丝曙光.搜狗搜索推出了内容搜索和公众号搜索两种,利用后者可以抓取微信公众号的最新内容,看了下还是比较及时的. 每个公众号都有一个open ...

  8. python爬虫(17)爬出新高度_抓取微信公众号文章(selenium+phantomjs)

    个人博客请访问 http://www.x0100.top 一.思路分析 目前所知晓的能够抓取的方法有: 1.微信APP中微信公众号文章链接的直接抓取(http://mp.weixin.qq.com/s ...

  9. python抓取微信公众号文章及评论(附过程)

    需求:抓取人民网微信公众号的文章和评论 使用工具: fiddler python3 微信pc客户端 破解过程: 首先 使用fiddler对微信pc端抓包,需要配置https证书,另外最好加个filte ...

最新文章

  1. 加载vue文件步骤_无法在重新加载时读取vue文件
  2. mysql查询时调用函数_【性能测试】性能测试时对Mysql数据库的慢查询监控
  3. html图片显示和夫宽一样,功夫:HTML和CSS?
  4. 采购订单检查/保存BADI使用
  5. ubuntu14.04 访问windows目录的方法 mount.cifs方式 取代smbfs方式
  6. Swift iOS : WebView缓存图片的方法
  7. Android之6.0上的重要变化(一)
  8. 华为服务器驱动_不可错过的华为核心概念股
  9. 数据结构-链表4-企业链表
  10. 【Navicat】查看1000行以后的内容
  11. echo -e “\033[字背景颜色 字体颜色m字符串\033[0m“解释
  12. PyCharm中脚本文件无法识别相对路径
  13. 误删PPT文件,如何用EasyRecovery自救?
  14. SPD软件(医用耗材管理系统)应用效果分析
  15. 屏幕画笔工具pointofox安装过程
  16. 如何破解WP7并安装xap文件
  17. 京东在线客服话术汇总!
  18. 移动通信基础(12)分集
  19. Python+matplotlib绘制极坐标柱状图(南丁格尔玫瑰图)
  20. 对HackTheBox里面的Bastion测试

热门文章

  1. java循环例题while型_Java基础--while、do-while、for循环结构(附例题)
  2. SpringBoot+Vue实现邮箱登录注册找回密码(附接口文档)
  3. 请将文件MP_verify_N8no8dpNO9n7wuBZ.txt上传至XXX指向的web服务器(或虚拟主机)的目录
  4. Qt中使用DirectX
  5. android SurfaceView + Camera全屏自适应屏幕尺寸
  6. 免单拼团商城小程序开发
  7. java毕业设计多少钱?不如自己尝试做一下
  8. 每日获取强智教务系统课表,并发送短信到学生手机!爬虫真牛逼!
  9. buu刷题记录 [PWNHUB 公开赛 2018]傻 fufu 的工作日
  10. 刘墉写给女儿的 忠告