网页采集AJAX滚动教程,以新浪微博评论采集为例

2019-03-17

八爪鱼7.0教程——AJAX滚动教程

标签: 新手入门,新手,v7.0 2017/6/23 18:20:20

AJAX滚动教程

本文用于讲述AJAX网站中AJAX滚动的设置。

示例网站:

http://weibo.com/1893801487/F8yXEAh0i?ref=feedsdk&type=comment#_rnd1497952450258

AJAX滚动示例:

步骤一:打开网页→设置循环提取数据

说明:

如图所示,我们采集的是微博页面,此处设置循环提取所有该微博评论的评论人和评论内容,提取为一条信息,我们在下一步验证网页是否AJAX滚动模式中可以用到循环提取中显示循环列表的作用。

步骤二:验证网页是否AJAX滚动模式→设置页面加载完成后向下滚动

说明:

验证网页是否AJAX滚动模式步骤中,我们首先重新打开网页查看了并点击了循环框,通过循环列表我们可以看到当前网页可以提取到多少条数据,随后我们将网页向下滚动,可以发现滚动条回弹了两次,回弹表示页面加载出了新的数据,同时观察网页没有加载状态图标,说明该网页使用了AJAX滚动方法来加载数据。通过网页回弹了两次,多加载出来30条数据我们可以知道,每次新加载会加载出15条数据。

AJAX滚动的两种方式:

AJAX滚动有两种模式,分别是向下滚动一屏和直接滚动到底部。

直接滚动到底部是直接让界面滚动到页面的最下部,向下滚动一屏是让网页滚动当前屏幕一屏的内容。一般常用直接滚动到底部功能,特殊情况使用向下滚动一屏。

下图可以看到本示例中,滚动前后,图1图2循环列表内数据条目由15条变为45条,而数据的开头部分未发生改变,说明页面滚动后,新加载的数据出现在原本的数据后面,之前的数据依然会显示,这时我们可以使用滚动到底部,页面加载了两次,我们便设置滚动次数为2-3次即可,滚动时间是防止滚动后,数据还没加载出来便再次滚动导致不能加载出新数据,示例中设置为2秒。

图1:滚动到底部滚动前循环列表

图2:滚动到底部滚动后循环列表

步骤三:保存并启动

那什么情况下使用向下滚动一屏呢?

假如我们滚动网页时发现向下滚动到底部后,网页中原本开头部分或者中间某部分的数据被隐藏,需要向上滚动重新加载,即网页只加载一屏新增数据,我们假设示例情况变更为只加载开头部分与仅一屏新增数据的情况,具体如下图:

图3:向下滚动一屏滚动前循环列表(图中为循环列表最后几条数据)

图4:向下滚动一屏第一次滚动循环列表(图中为循环列表中,新增数据与最初数据接合处)

图5:向下滚动一屏第二次滚动循环列表(图中为循环列表中,新增数据与最初数据接合处)

上图分别为滚动前后的循环列表,可以看到滚动前即图3中,循环可以抓取到页面内15条数据,而滚动第一次即图4中,循环列表可以抓取到的数据为30条,数据接合处如图所示。滚动第二次即图5中,循环列表可以抓取到的数据依然为30条,但是滚动第一次图4下方新增的15条数据被隐藏,只显示开头数据以及第二次滚动新增数据。

面对此种情况,我们便需要向下滚动一屏功能来实现循环采集一屏内容数据的功能,具体操作需要你有一定八爪鱼使用经验,这里不做过多叙述。

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。

http://www.pinlue.com/style/images/nopic.gif

ajax文章采集6,网页采集AJAX滚动教程,以新浪微博评论采集为例相关推荐

  1. 大数据信息资料采集:网易云音乐QQ音乐歌曲基本信息及评论采集爬虫

    大数据信息资料采集:网易云音乐QQ音乐歌曲基本信息及评论采集 数据采集满足多种业务场景:适合产品.运营.销售.数据分析.政府机关.电商从业者.学术研究等多种身份职业. 舆情监控:全方位监测公开信息,抢 ...

  2. 免费聚合文章dedeCMS采集脚本网页采集器

    dedecms以简单.实用.开源而闻名,是国内最知名的PHP开源网站管理系统,也是使用用户最多的PHP类CMS系统,在经历多年的发展,无论是在版本还是在功能,都有了长久的发展和进步,DedeCms主要 ...

  3. selenium爬取Ajax加载的网页(以微博为例)

    Tip:我写了一篇直接构造请求获取微博数据的文章,不使用selenium,直接访问url获取到json数据,然后解析即可得到想要的数据的文章,请参考微博博主动态及相册的请求构造规律 ========= ...

  4. 金融数据获取:通过Ajax跳转的网页怎么爬?以东方财富基金净值数据为例

    你是否碰到过点击网站上的按钮或链接,网页数据进行了刷新,但浏览器上显示的网址却没有任何变化的情况,这其实就是利用Ajax跳转的网页.本期笔者将以东方财富网为例展示如何获取Ajax跳转的网页内容,本文主 ...

  5. ajax资料收集-Ajax文章(教程和实例)---Ajax资源下载(源码和教程)---Ajax规范标准

    CSDN Blog Ajax文章搜索: http://search.csdn.net/search/ajax/1/blog/ 专题:Ajax技术应用开发 http://www.51cto.com/ht ...

  6. Ajax广告词,用 ajax 的方法解决网页广告显示的问题

    用 ajax 的方法解决网页广告显示的问题 2017年12月12日 | 萬仟网IT编程 | 我要评论 有的时候google或者其他广告显示不出来,造成页面访问速度奇慢,怎么样解决这个问题呢?我们可以借 ...

  7. Msdn 杂志 asp.net ajax 文章汇集

    asp.net ajax 充分利用客户端 JavaScript.DHTML 和 XMLHttpRequest 对象.其目的是帮助开发人员创建更具交互性的支持 AJAX 的 Web 应用程序 ASP.N ...

  8. 前嗅教你大数据:批量采集/下载网页中的图片数据

    l 采集网站 [场景描述]采集revisionvillage网页中所有真题图片的数据. [源网站介绍]revisionvillage,国外知名IB真题网站,每道题都有视频讲解的IB数学刷题网站. [使 ...

  9. 微信公众号采集,历史文章采集,万能key采集,点赞阅读评论采集

    微信采集的重点就是微信公众号相关的数据.主要是发布的文章.其他的话还有点赞阅读以及公众号的账号信息等.下面会大家一一说明如何采集.以及采集的一些限制. 首先是数据来源.主要分为两大块.客户端采集和搜狗 ...

最新文章

  1. JAVA ssm b2b2c多用户商城系统源码 (十二)springboot集成apidoc
  2. Win2003 Server手动设置全攻略
  3. 2021年最后几天,使用SSM实现网上购物商城系统
  4. vsFTPd 服务器初学者指南
  5. Android 中 JUnit 测试的配置
  6. 深圳6月23号活动《产品经理三分钟》报名开始啦!
  7. 集成运放组成的电压比较器
  8. linux命令--cp
  9. js里apply方法的简单实例
  10. 50行代码串行Promise,koa洋葱模型原来这么有趣?
  11. 移动端H5终端适配方案
  12. BAT 数据披露:缺人!110万AI人才缺口,两者矛盾,凉凉了!
  13. C#常见委托のdelegate定义,Func,Action,Predicate总结
  14. 纸质办公电子化——iWebOffice中间件
  15. Antd如何用Menu组件渲染二级或三级目录
  16. ICMP协议个人分析
  17. 学习java哪个网课最好_学习Java的最佳方法
  18. thinkphp 3.2引入第三方类
  19. 两数之和——python
  20. 论文阅读笔记--Federated Continual Learning with Weighted Inter-client Transfer

热门文章

  1. 肝2022世界杯,怒写企业级镜像私仓Docker+Harbor实践
  2. 【逻辑漏洞技巧拓展】————4、逻辑漏洞之支付漏洞
  3. 最小描述长度(MDL)
  4. 华为手机用什么蓝牙耳机好?五一出游最值得买的蓝牙耳机推荐
  5. C/C++_大正整数的加法运算代码实现
  6. 高通MSM895x:充电功能调试
  7. js保留多少位数小数点
  8. 机器学习相关概念、分类、要解决的任务
  9. 【面试】面试官:说一说H5新特性
  10. 实现微信公众号发送消息给指定用户