爬取Google Play中app的用户评论(2)
我遇到的下一个困难是如何爬取完整的用户评论
如图,很多评论都是折叠起来的 要是想直接获取完整的用户评论,最后只能得到空值
于是我尝试另外写一个方法来获取完整的评论 结果不尽人意
然后我看书上的实例有用selector获取网页源代码的方法
先获取网页源代码 就可以直接获取完整的用户评论了
selector = etree.HTML(driver.page_source)
usereviews = selector.xpath('//span[@jsname="fbQN7e"]')
这样获取的是页面所有的用户评论
现在要做的就是把用户评论一条一条的展现出来
于是用到了一个for循环语句
在此过程中绕了许多弯路 一开始想要把所有的信息
比如用户名 日期 评分 评论等信息都放到一个for循环
为此尝试了许久 最大的困难就是
除了用户评论外的所有信息都可以直接获得
而评论要首先按一个 full review按钮把评论的全部内容都展现出来之后才能获取完整的评论
而按按钮和获取评论必须紧接着一起实现
否则就不能确定按按钮和获取评论是不是同一个用户评论中的内容了
因此我只好把获取评论单独的放到一个for循环中
然后呢 有少数的用户评论很简短 不用按按钮就可以获取全部信息
那么这样的话 获取用户评论就要分情况讨论了
爬取Google Play中app的用户评论(2)相关推荐
- 爬取某东购买猪肉的用户评论,为生产经营提供了方向性参考
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于乡村四十二,作者至善 背景 最近在调研电商平台黑猪肉市场需求情况,电商平台有效的用户 ...
- python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论——学霸君
python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论--学霸君 import requests import re import requests from bs4 import ...
- 利用python的scrapy框架爬取google搜索结果页面内容
scrapy google search 实验目的 爬虫实习的项目1,利用python的scrapy框架爬取google搜索结果页面内容. https://github.com/1012598167/ ...
- python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论——作业帮
python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论--作业帮 import requests import re import requests from bs4 import ...
- 爬取Google patent上公司所有专利
爬取Google patent上公司所有专利 需求:给出了需要爬取的公司列表,形式如下: ['DURATA THERAPEUTICS INC','DYNAVAX TECHNOLOGIES CORP'] ...
- python3 爬虫数据处理 爬取华为应用市场 APP应用评论(二)根据评论生成词云——小猿搜题
python3 爬虫&数据处理 爬取华为应用市场 APP应用评论(二)根据评论生成词云--小猿搜题 # 导入扩展库 import re # 正则表达式库 import collections ...
- python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论——小猿搜题
python3 爬虫 爬取华为应用市场 APP应用评论(一)爬取全部评论--小猿搜题 import requests import re import requests from bs4 import ...
- 爬取Google Scholar论文列表,如何利用公开数据进行合著作者分析?
Preface 之前同学读研选导师,帮忙参考了一下.我发现有些老师很年轻,但是 Google Scholar 各项数据都高得离谱(主要是 citation 和 h-index ),甚至轻松碾压一些在人 ...
- 爬取google scholar数据
突破限制爬取网页数据 googlesholar为例[转] 分类: 常用工具使用 2010-11-04 09:23 931人阅读 评论(1) 收藏 举报 浏览器google服务器stringwindow ...
最新文章
- Python实现全民K歌歌曲下载
- delphi windows编程_2020年值得关注的新编程V语言Vlang,对标Golang、Rust、Swift
- 【教女朋友学网络系列4】之今天教她一些简单的交换机实验
- Python源码阅读-内存管理机制(一)
- 341. 扁平化嵌套列表迭代器
- 华科02年计算机考研复试机试
- 女子驾驶蔚来汽车被迫停留长安街超1小时 官方回应:司机连续误操作
- [转载][HASS.IO] 【HASSOS安装】成功安装HASSOS 1.9(避开了大部分坑版)
- CSDN《程序员》杂志创始人 蒋涛推荐《程序员求职第一书》
- MBR、主引导扇区,主分区、扩展分区、逻辑分区,活动分区、引导分区、系统分区、启动分区的区别详解
- 国内开发商品基金的一些设想
- 软考软件设计师中级考试知识点(一)
- 如何选择和更换阿里云服务器操作系统?
- 记录前端导出word 本地图片不显示问题
- usb启动盘提示vesamenu.c32 not a COM32R image
- 数据挖掘算法原理与实践:数据预处理
- 杰奇安装 mysql失败_关于杰奇CMS安装乱码的解决方法
- 关于字符集(彻底搞清楚一个中文占几个字节?)
- 大数据发展趋势及动态
- 教育部原副部长张天保谈教育改革,强调教育与科技深度融合
热门文章
- ajax modal 关闭,iview中Modal对话框提交控制关闭
- 摘录 | 《十二个圣诞故事》
- 在iphone中添加铃音
- 千斤顶装配图怎么画_工程制图习题集千斤顶装配图
- 高效的六面体变换算法实现(一) —— 等圆柱映射 与 六面体映射(MarkDown编辑器版)
- Face Detection paper 1st season
- FPGA学习5-PL和PS互联
- 民用飞机着陆阶段着陆方法_着陆区第二部分的解剖
- Meta元宇宙内容VP:VR游戏与元宇宙关系紧密,社交并非全部
- 【LIO-SAM论文全文翻译】:LIO-SAM: Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping