Python 爬取微信朋友圈的方法
在几年前,互联网上曾经出现过一款生成朋友圈相册的产品。但是它的流程说起来很不互联网:
首先,需要添加指定的微信号,并且给这个微信号查看自己朋友圈的权限;
然后,等待几个小时;
最后,得到一个链接,里面用相册模板显示了自己的朋友圈内容;
最开始听起来觉得很牛逼,心想这款产品是怎么拿到个人的朋友圈数据的,直到看到它的使用流程首先需要添加微信好友,瞬间就笑着明白了。
其实,朋友圈一直是很多人的爬虫想要采集的领地。
在之前,朋友圈只能在手机或Pad上查看,要想获取朋友圈的数据,要么手工进行人肉复制,要么通过钩子进行处理。
这两种操作一个太低端了,一个又太高端了。
有没有稍微简单一点的呢?用 Appnium 或许是一个方法,操作起来比钩子简单多了,但是,Appnium 的环境配置,就会吓跑很多朋友了。
所以,Appnium 还是门槛稍高。
直到最近,微信电脑版开始支持朋友圈,事情似乎出现了转机!
所以可以通过 PyWinAuto 和 PyAutoGui 这两个工具,实现对桌面程序的自动化控制和数据采集。
这两个工具,是否可以应用在微信朋友圈数据的采集上呢?
州的先生,立马写了个 Demo 来测试。
首先,引入所需的库:
import psutil
import pywinauto
from pywinauto.application import Application
其中:
psutil 用于获取微信电脑版的进程信息;
pywinauto 用于自动化控制微信电脑版
然后,我们通过 psutil 库获取到微信电脑版程序的进程ID:
PID = 0
for proc in psutil.process_iter():
try:
pinfo = proc.as_dict(attrs=['pid', 'name'])
except psutil.NoSuchProcess:
pass
else:
if 'WeChat.exe' == pinfo['name']:
PID = pinfo['pid']
这个进程ID用来提供给 PyWinAuto 以连接微信电脑版。
然后,用 PyWinAuto 实例化一个应用:
app = Application(backend='uia').connect(process=PID)
接着控制微信电脑版,把朋友圈窗口打开:
win = app['微信']
pyq_btn = win.child_window(title="朋友圈", control_type="Button")
cords = pyq_btn.rectangle()
pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top + 10))
以上代码,就实现了 Python 代码控制微信电脑版打开朋友圈窗口。
效果如下所示:
朋友圈的窗口是打开了,如果获取里面的数据呢?
我们先用 .dump_tree() 方法看看朋友圈窗口里面各个控件的结构是怎样的:
print(pyq_win.dump_tree())
这会把朋友圈窗口内所有显示出来的组件的结构打印到控制台,其显示的内容如下图所示:
我们来看一个具体的例子,例如朋友圈内的这条信息:
它在 dump_tree() 中的结构如下所示:
可以看到,窗口内的每一个信息,比如联系人的名称、朋友圈内容、朋友圈发布时间等等都是各种组件构成的。
我们可以通过获取和控制这些个组件,来实现数据的提取。比如在这个例子里,我们就可以通过定位到 Edit 这个组件来获取到这条朋友圈的内容:
跟其他的工具比起来,是不是算是异常简单了?
不仅简单,效果还很不错。
感兴趣的朋友们,赶紧试试吧!
Python 爬取微信朋友圈的方法相关推荐
- Python爬虫爬取微信朋友圈的方法,感兴趣的朋友可以了解下
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 小雨 | 作者 python教程 | 来源 接下来,我们将实现微信朋友圈的 ...
- Python爬取微信朋友圈 ! 让屏蔽你的女神无处可躲 ?
接下来,我们将实现微信朋友圈的爬取. 如果直接用 Charles 或 mitmproxy 来监听微信朋友圈的接口数据,这是无法实现爬取的,因为数据都是被加密的.而 Appium 不同,Appium 作 ...
- python 爬取微信朋友圈的一些信息
一.工具:使用python 3.6 自带的编辑器IDEL,在命令行可以正常运行. 二.此程序用到的一些库和包: (1)itchat:itchat是一个开源的微信个人号接口,可以登录微信账号:点击打开链 ...
- Python爬虫爬取微信朋友圈
更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接: 高州阳光论坛https://www.hnthzk.com/ 人人影视http://www.op-kg.com/ ...
- python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...
原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...
- Python爬虫实战项目案例——爬取微信朋友圈
项目实战 Appium爬取微信朋友圈 自动化爬取App数据 基于移动端的自动化测试工具Appium的自动化爬取程序. 步骤 1.JDK - Download JDK,Appium要求用户必须配 ...
- 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)
前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...
- python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)
前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...
- python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
- python爬取微信朋友圈图片_使用python itchat包爬取微信好友头像形成矩形头像集的方法...
初学python,我们必须干点有意思的事!从微信下手吧! 头像集样例如下: 大家可以发朋友圈开启辨认大赛哈哈~ 话不多说,直接上代码,注释我写了比较多,大家应该能看懂 import itchat im ...
最新文章
- 将base64编码图片上传到七牛云
- java web学习笔记-jsp篇
- 设置elf文件链接库的路径
- java线程栅栏_Java 多线程基础 - CyclicBarrier
- 谈谈我对Java中CallBack的理解
- 使用纯粹的ABAP位操作实现两个整数相加
- 明年3月开卖!小米11超大杯有望搭载屏下摄像头技术
- java 访问频率限制_配置URL的访问频率限制
- 动态添加select2input没样式_MIUI10壁纸升级:桌面动效壁纸与动态壁纸的前世今生...
- 8086汇编语言实现数组冒泡排序(全注释)
- unbantu安装 mysql --- 百度云
- 03JavaScript程序设计修炼之道_2019-06-18_21-41-56_事件onfocus
- 查看电脑显卡(GPU)是否支持CUDA
- 唱响艾泽拉斯_搞笑篇
- 仿9GAG制作过程(三)
- Mac升级系统后,Android Studio 不能用问题
- Python os.symlink创建软链接
- 赋值运算和赋值表达式
- 数学建模常用模型05 :多元回归模型
- 危化品从业人员考试题目及答案