本文利用Appium实现一个抓取微信朋友圈信息的爬虫。在编写爬虫之前,先要启动Appium服务器。

编写基于Appium的爬虫,关键就是分析App每个界面相关元素的特征,也就是如何获取这些元素,然后在这些元素上执行特定的动作,如点击、输入字符串等。

微信App的大多数元素都是单一的元素,如按钮、文本框等,直接使用Appium很容易定位。比较复杂的是朋友圈信息,编写过Android App的读者应该可以猜到,朋友圈很明显是一个列表,在Android App中,列表通常用ListView控件实现,而且采用了动态向ListView控件添加Item的方式。所以首先要定位到这个现实朋友圈的ListView控件。

将微信App切换到朋友圈页面,然后刷新Appium,会在左侧看到朋友圈页面,然后将微信App的朋友圈向下滚动,这是在Appium上定位,会找到如图1所示的ListView控件,而每一个Item就是一个FrameLayout。每一个FrameLayout的id都是一样的。这个id是com.tencent.mm:id/emw,所以我们只需要获得当前页面所有ID是com.tencent.mm:id/

Python爬虫编程思想(133):项目实战--利用Appium抓取微信朋友圈信息相关推荐

  1. python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  2. 2018最全如何利用Python网络爬虫抓取微信朋友圈的动态

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  3. python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  4. 如何利用Python网络爬虫抓取微信朋友圈的动态(上)

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  5. 如何利用Python网络爬虫抓取微信朋友圈的动态

    1.引言 最近初学Python,写爬虫上瘾.爬了豆瓣练手,又爬了公司的论坛生成词云分析年度关键词.最近琢磨着2017又仅剩两月了,我的年度关键词是啥? 所以自然想到爬取下自己的微信朋友圈,来个词频分析 ...

  6. 批量抓取微信朋友圈 Java_微信朋友圈转疯了(golang写小爬虫抓取朋友圈文章)...

    很多人在朋友圈里转发一些文章,标题都是什么转疯啦之类,虽然大多都也是广告啦,我觉得还蛮无聊的,但是的确是有一些文章是非常值得收藏的,比如老婆经常就会收藏一些养生和美容的文章在微信里看. 今天就突发奇想 ...

  7. [Python爬虫] 之三十:Selenium +phantomjs 利用 pyquery抓取栏目

    一.介绍 本例子用Selenium +phantomjs爬取栏目(http://tv.cctv.com/lm/)的信息 二.网站信息 三.数据抓取 首先抓取所有要抓取网页链接,共39页,保存到数据库里 ...

  8. Python爬虫爬取微信朋友圈的方法,感兴趣的朋友可以了解下

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 小雨 | 作者 python教程 | 来源 接下来,我们将实现微信朋友圈的 ...

  9. Python爬虫爬取微信朋友圈

    更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接: 高州阳光论坛https://www.hnthzk.com/ 人人影视http://www.op-kg.com/ ...

最新文章

  1. 文件查找利器---find详解
  2. rethat安装MySQL多例_Spring框架-Bean作用域中单例模式和多例模式的区别
  3. AngularJS 指令之 ng-hide/ng-show
  4. CentOS7.2 安装Squid3.5及正、反向代理设置
  5. 利用开源社区打造微服务生态体系
  6. beego1---beego,bee环境配置
  7. 处理百万级以上的数据提高查询速度的方法
  8. PHP 获取服务器详细信息【转】
  9. 计算机网络-自顶向下方法 第五章课后习题答案(第七版)
  10. 只需要这三个步骤让你轻松搞定Maya中贴hdr贴图
  11. Excel 数据透视表小技巧之 05 如何计算重复项,一个包含重复的邮政编码列表,需要每个邮政编码有多少个实例(教程含数据)
  12. matlab小波变换学习入门
  13. 彻底干掉霸占我任务栏的2345好压的垃圾广告搜索以及天气预告工具栏
  14. Exchange高危0day漏洞 -- 直接拿下你的域控和服务器 -- 立即行动!CVE-2021-26855
  15. 取整函数(ceil、floor、round)
  16. 让摄像头脱离线的束缚:使用手机充当电脑摄像头
  17. BUUCTF——CRYPTO(记录不熟悉的题)(4)
  18. 车间制造管理系统(上)
  19. 每日一题:1894.找到需要补充粉笔的学生编号 简单的模拟题目,注意求余的技巧!...
  20. 数组下标访问越界导致溢出1

热门文章

  1. php phalcon 安装,Phalcon框架安装与使用教程介绍
  2. 计算机专业必要要买游戏本吗,吾空:致大学想买游戏笔记本的学生,这几个点必须要知道...
  3. 读《当众讲话诀窍》-殷亚敏 (2)
  4. 多任务学习时转角遇到Bandit老虎机
  5. java打印 X XX XXX XXXX
  6. JSP使用Struts1提交中文表单时乱码,字符编码问题
  7. POJ 2152 树型DP //很棒的题
  8. html基本样式及表格
  9. 直通大厂web入门级网页快速开发(建议收藏)
  10. 我的第一篇SPL(Signal Processing Letters)的写作旅途