1分钟轻松爬数据(web scraper插件使用教程)

前提你已安装web scraper(Google,FireBox商店都有)。
说明:安装后右键查看元素或检查即可看到web scraper,简介如图.
刚开始只能点第一个(显示你自己建的要爬的所有网站)和第三个(可以创建或导入)
(导入可以查看网站http://www.iwebscraper.com/category/%e6%a8%a1%e6%9d%bf/)

  1. 建一个sitemap

  2. 建好后点击你建的sitemap就可以创建你要抓去的数据了
    3. 这个时候创建一个获取所有元素。
    选择元素

    后面就可以创建需要的数据了。我只写一个

    这就完了。
    最简单就是导入
    例子

{"_id":"keepallcourses","startUrl":["https://www.gotokeep.com/all_courses/"],"selectors":[{"id":"element","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"li","multiple":true,"delay":"2000"},{"id":"name","type":"SelectorText","parentSelectors":["element"],"selector":"div.name","multiple":false,"regex":"","delay":0},{"id":"classnumber","type":"SelectorText","parentSelectors":["element"],"selector":"span:nth-of-type(1)","multiple":false,"regex":"","delay":0},{"id":"bodypart","type":"SelectorText","parentSelectors":["element"],"selector":"span:nth-of-type(2)","multiple":false,"regex":"","delay":0},{"id":"difficult","type":"SelectorText","parentSelectors":["element"],"selector":"div.level","multiple":false,"regex":"","delay":0},{"id":"apparatus","type":"SelectorText","parentSelectors":["element"],"selector":"div.equipment","multiple":false,"regex":"","delay":0},{"id":"trainnumber","type":"SelectorText","parentSelectors":["element"],"selector":"div.pioneer","multiple":false,"regex":"","delay":0}]}

》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
第一次写就这这样吧!
有关webscraper的问题,看这个就够了https://www.jianshu.com/p/cd5124ac0871
web scraper 抓取分页数据和二级页面内容https://www.cnblogs.com/fengzheng/p/9328481.html

1分钟轻松爬数据(web scraper插件使用教程)相关推荐

  1. Web scraper 爬虫傻瓜教程(不断更新中)

    教程 安装 基本操作 打开Web scraper 使用Web scraper 创建爬取 运行爬虫,查看数据 这里讲一个复杂一点的例子帮助大家学习 参考: 安装 Web scraper只支持chrome ...

  2. 使用Web Scraper插件实现简单爬虫

    1.添加扩展程序 Microsoft Edge添加扩展程序Web Scraper(蜘蛛网图标) 2.进入开发者模式 在所需爬取网页界面下,打开Web Scraper:Windows系统下使用 Ctrl ...

  3. 如何用arduino+ethernet shield(W5100)与yeelink结合5分钟实现传感器数据web上传

    转自Yeelink博客.http://blog.yeelink.net/?p=34 本文介绍如何在Arduino上实现自己的Yeelink客户端,以便将采集到的传感器数据上传到Yeelink平台上.该 ...

  4. 使用 Chrome 浏览器插件 Web Scraper 10分钟轻松实现网页数据的爬取

    web scraper 下载:Web-Scraper_v0.2.0.10 使用 Chrome 浏览器插件 Web Scraper 可以轻松实现网页数据的爬取,不写代码,鼠标操作,点哪爬哪,还不用考虑爬 ...

  5. Chrome 爬虫插件 Web Scraper

    Web Scraper 官网:https://webscraper.io/ 有关webscraper的问题,看这个就够了(建议收藏): https://zhuanlan.zhihu.com/p/341 ...

  6. Web Scraper爬取信息

    前期条件:安装web scraper插件: 安装好之后,打开网页调试模式,F12 会看到多出来Web Scraper: 实践: 以豆瓣网为例: 爬取租房信息: Type有很多类型: 这里选择是表格,需 ...

  7. 十分钟轻松学会python-10分钟轻松学会python turtle绘图

    python2.6版本中后引入的一个简单的绘图工具,叫做海龟绘图(Turtle Graphics),turtle库是python的内部库,使用导入即可 import turtle 先说明一下turtl ...

  8. nodejs之简单的爬数据

    nodejs 之简单爬数据 准备 cheerio 插件 cheerio 是一个为服务器特别定制的,快速.灵活.实施的 jQuery 核心实现方案. axios 插件 axios 是一个基于 promi ...

  9. webscraper多页爬取_数据收集:web scraper 多页(无规律url)抓取

    前言 web scraper是一个很好用的Chrome爬虫插件,它易学易用,能够满足大部分需求,而且因为是基于浏览器渲染的,所以能回避很多反爬虫问题.另外,web scraper可以多开进程,对于一些 ...

最新文章

  1. Win64 驱动内核编程-15.回调监控注册表
  2. [MySQL优化案例]系列 -- 用TIMESTAMP类型取代INT和DATETIME
  3. 如何选择适合自己网站的防盗链
  4. Android使用SVG矢量图打造酷炫动效!
  5. Python3 爬虫实战 — 58同城武汉出租房【加密字体对抗】
  6. java中得到classpath和当前类的绝对路径的一些方法(路径中的%20进行替换空格)...
  7. IIS负载均衡-Application Request Route详解第二篇:创建与配置Server Farm(转载)
  8. 95-862-045-源码-runtime-blob-BlobService
  9. 异常:Invalid or unexpected token
  10. SpringBoot整合MyBatis后台分页前端BootstrapTable添加删除查看编辑搜索数据(二)
  11. 家政O2O要在寒冬下为用户创造体验春天
  12. 2017嵌入式软件行业现状及概述
  13. Rational rose 安装教程
  14. 矩阵转置---c语言实现
  15. 360免费wifi设置位置服务器,win10系统使用360免费wifi的操作方法
  16. 移动医疗APP的渠道策略
  17. Cache架构以及X86ARM @Linux平台cache eviction功能测试
  18. sublime匹配汉字
  19. Samsung/三星I9128 Galaxy Grand root教程_方法
  20. pytorch 中 利用自定义函数 get_mask_from_lengths(lengths, max_len)获取每个batch的mask

热门文章

  1. SQL Server无法以local 登陆问题的解决方法provider: Named Pipes Provider, error: 40 - Could not open a connection
  2. stm32+W5500+阿里物联网平台
  3. allegro如何快设置快捷键旋转器件
  4. ESP8266模块睡眠模式
  5. 云和恩墨荣获阿里云云合计划2021年度优秀伙伴技术先锋奖
  6. XZ_iOS 之各大银行URL Schemes
  7. 角色动画中的骨骼蒙皮技术
  8. C# 关于压缩、加密、解压问题
  9. 乔布斯逝去十年 苹果坠入凡间?
  10. 【leetcode】电话号码的字母组合