ajax文章采集6,网页采集AJAX滚动教程,以新浪微博评论采集为例
网页采集AJAX滚动教程,以新浪微博评论采集为例
2019-03-17
八爪鱼7.0教程——AJAX滚动教程
标签: 新手入门,新手,v7.0 2017/6/23 18:20:20
AJAX滚动教程
本文用于讲述AJAX网站中AJAX滚动的设置。
示例网站:
http://weibo.com/1893801487/F8yXEAh0i?ref=feedsdk&type=comment#_rnd1497952450258
AJAX滚动示例:
步骤一:打开网页→设置循环提取数据
说明:
如图所示,我们采集的是微博页面,此处设置循环提取所有该微博评论的评论人和评论内容,提取为一条信息,我们在下一步验证网页是否AJAX滚动模式中可以用到循环提取中显示循环列表的作用。
步骤二:验证网页是否AJAX滚动模式→设置页面加载完成后向下滚动
说明:
验证网页是否AJAX滚动模式步骤中,我们首先重新打开网页查看了并点击了循环框,通过循环列表我们可以看到当前网页可以提取到多少条数据,随后我们将网页向下滚动,可以发现滚动条回弹了两次,回弹表示页面加载出了新的数据,同时观察网页没有加载状态图标,说明该网页使用了AJAX滚动方法来加载数据。通过网页回弹了两次,多加载出来30条数据我们可以知道,每次新加载会加载出15条数据。
AJAX滚动的两种方式:
AJAX滚动有两种模式,分别是向下滚动一屏和直接滚动到底部。
直接滚动到底部是直接让界面滚动到页面的最下部,向下滚动一屏是让网页滚动当前屏幕一屏的内容。一般常用直接滚动到底部功能,特殊情况使用向下滚动一屏。
下图可以看到本示例中,滚动前后,图1图2循环列表内数据条目由15条变为45条,而数据的开头部分未发生改变,说明页面滚动后,新加载的数据出现在原本的数据后面,之前的数据依然会显示,这时我们可以使用滚动到底部,页面加载了两次,我们便设置滚动次数为2-3次即可,滚动时间是防止滚动后,数据还没加载出来便再次滚动导致不能加载出新数据,示例中设置为2秒。
图1:滚动到底部滚动前循环列表
图2:滚动到底部滚动后循环列表
步骤三:保存并启动
那什么情况下使用向下滚动一屏呢?
假如我们滚动网页时发现向下滚动到底部后,网页中原本开头部分或者中间某部分的数据被隐藏,需要向上滚动重新加载,即网页只加载一屏新增数据,我们假设示例情况变更为只加载开头部分与仅一屏新增数据的情况,具体如下图:
图3:向下滚动一屏滚动前循环列表(图中为循环列表最后几条数据)
图4:向下滚动一屏第一次滚动循环列表(图中为循环列表中,新增数据与最初数据接合处)
图5:向下滚动一屏第二次滚动循环列表(图中为循环列表中,新增数据与最初数据接合处)
上图分别为滚动前后的循环列表,可以看到滚动前即图3中,循环可以抓取到页面内15条数据,而滚动第一次即图4中,循环列表可以抓取到的数据为30条,数据接合处如图所示。滚动第二次即图5中,循环列表可以抓取到的数据依然为30条,但是滚动第一次图4下方新增的15条数据被隐藏,只显示开头数据以及第二次滚动新增数据。
面对此种情况,我们便需要向下滚动一屏功能来实现循环采集一屏内容数据的功能,具体操作需要你有一定八爪鱼使用经验,这里不做过多叙述。
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。
http://www.pinlue.com/style/images/nopic.gif
ajax文章采集6,网页采集AJAX滚动教程,以新浪微博评论采集为例相关推荐
- 大数据信息资料采集:网易云音乐QQ音乐歌曲基本信息及评论采集爬虫
大数据信息资料采集:网易云音乐QQ音乐歌曲基本信息及评论采集 数据采集满足多种业务场景:适合产品.运营.销售.数据分析.政府机关.电商从业者.学术研究等多种身份职业. 舆情监控:全方位监测公开信息,抢 ...
- 免费聚合文章dedeCMS采集脚本网页采集器
dedecms以简单.实用.开源而闻名,是国内最知名的PHP开源网站管理系统,也是使用用户最多的PHP类CMS系统,在经历多年的发展,无论是在版本还是在功能,都有了长久的发展和进步,DedeCms主要 ...
- selenium爬取Ajax加载的网页(以微博为例)
Tip:我写了一篇直接构造请求获取微博数据的文章,不使用selenium,直接访问url获取到json数据,然后解析即可得到想要的数据的文章,请参考微博博主动态及相册的请求构造规律 ========= ...
- 金融数据获取:通过Ajax跳转的网页怎么爬?以东方财富基金净值数据为例
你是否碰到过点击网站上的按钮或链接,网页数据进行了刷新,但浏览器上显示的网址却没有任何变化的情况,这其实就是利用Ajax跳转的网页.本期笔者将以东方财富网为例展示如何获取Ajax跳转的网页内容,本文主 ...
- ajax资料收集-Ajax文章(教程和实例)---Ajax资源下载(源码和教程)---Ajax规范标准
CSDN Blog Ajax文章搜索: http://search.csdn.net/search/ajax/1/blog/ 专题:Ajax技术应用开发 http://www.51cto.com/ht ...
- Ajax广告词,用 ajax 的方法解决网页广告显示的问题
用 ajax 的方法解决网页广告显示的问题 2017年12月12日 | 萬仟网IT编程 | 我要评论 有的时候google或者其他广告显示不出来,造成页面访问速度奇慢,怎么样解决这个问题呢?我们可以借 ...
- Msdn 杂志 asp.net ajax 文章汇集
asp.net ajax 充分利用客户端 JavaScript.DHTML 和 XMLHttpRequest 对象.其目的是帮助开发人员创建更具交互性的支持 AJAX 的 Web 应用程序 ASP.N ...
- 前嗅教你大数据:批量采集/下载网页中的图片数据
l 采集网站 [场景描述]采集revisionvillage网页中所有真题图片的数据. [源网站介绍]revisionvillage,国外知名IB真题网站,每道题都有视频讲解的IB数学刷题网站. [使 ...
- 微信公众号采集,历史文章采集,万能key采集,点赞阅读评论采集
微信采集的重点就是微信公众号相关的数据.主要是发布的文章.其他的话还有点赞阅读以及公众号的账号信息等.下面会大家一一说明如何采集.以及采集的一些限制. 首先是数据来源.主要分为两大块.客户端采集和搜狗 ...
最新文章
- JAVA ssm b2b2c多用户商城系统源码 (十二)springboot集成apidoc
- Win2003 Server手动设置全攻略
- 2021年最后几天,使用SSM实现网上购物商城系统
- vsFTPd 服务器初学者指南
- Android 中 JUnit 测试的配置
- 深圳6月23号活动《产品经理三分钟》报名开始啦!
- 集成运放组成的电压比较器
- linux命令--cp
- js里apply方法的简单实例
- 50行代码串行Promise,koa洋葱模型原来这么有趣?
- 移动端H5终端适配方案
- BAT 数据披露:缺人!110万AI人才缺口,两者矛盾,凉凉了!
- C#常见委托のdelegate定义,Func,Action,Predicate总结
- 纸质办公电子化——iWebOffice中间件
- Antd如何用Menu组件渲染二级或三级目录
- ICMP协议个人分析
- 学习java哪个网课最好_学习Java的最佳方法
- thinkphp 3.2引入第三方类
- 两数之和——python
- 论文阅读笔记--Federated Continual Learning with Weighted Inter-client Transfer