1分钟轻松爬数据(web scraper插件使用教程)
1分钟轻松爬数据(web scraper插件使用教程)
前提你已安装web scraper(Google,FireBox商店都有)。
说明:安装后右键查看元素或检查即可看到web scraper,简介如图.
刚开始只能点第一个(显示你自己建的要爬的所有网站)和第三个(可以创建或导入)
(导入可以查看网站http://www.iwebscraper.com/category/%e6%a8%a1%e6%9d%bf/)
建一个sitemap
建好后点击你建的sitemap就可以创建你要抓去的数据了
3. 这个时候创建一个获取所有元素。
选择元素
后面就可以创建需要的数据了。我只写一个
这就完了。
最简单就是导入
例子
{"_id":"keepallcourses","startUrl":["https://www.gotokeep.com/all_courses/"],"selectors":[{"id":"element","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"li","multiple":true,"delay":"2000"},{"id":"name","type":"SelectorText","parentSelectors":["element"],"selector":"div.name","multiple":false,"regex":"","delay":0},{"id":"classnumber","type":"SelectorText","parentSelectors":["element"],"selector":"span:nth-of-type(1)","multiple":false,"regex":"","delay":0},{"id":"bodypart","type":"SelectorText","parentSelectors":["element"],"selector":"span:nth-of-type(2)","multiple":false,"regex":"","delay":0},{"id":"difficult","type":"SelectorText","parentSelectors":["element"],"selector":"div.level","multiple":false,"regex":"","delay":0},{"id":"apparatus","type":"SelectorText","parentSelectors":["element"],"selector":"div.equipment","multiple":false,"regex":"","delay":0},{"id":"trainnumber","type":"SelectorText","parentSelectors":["element"],"selector":"div.pioneer","multiple":false,"regex":"","delay":0}]}
》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
第一次写就这这样吧!
有关webscraper的问题,看这个就够了https://www.jianshu.com/p/cd5124ac0871
web scraper 抓取分页数据和二级页面内容https://www.cnblogs.com/fengzheng/p/9328481.html
1分钟轻松爬数据(web scraper插件使用教程)相关推荐
- Web scraper 爬虫傻瓜教程(不断更新中)
教程 安装 基本操作 打开Web scraper 使用Web scraper 创建爬取 运行爬虫,查看数据 这里讲一个复杂一点的例子帮助大家学习 参考: 安装 Web scraper只支持chrome ...
- 使用Web Scraper插件实现简单爬虫
1.添加扩展程序 Microsoft Edge添加扩展程序Web Scraper(蜘蛛网图标) 2.进入开发者模式 在所需爬取网页界面下,打开Web Scraper:Windows系统下使用 Ctrl ...
- 如何用arduino+ethernet shield(W5100)与yeelink结合5分钟实现传感器数据web上传
转自Yeelink博客.http://blog.yeelink.net/?p=34 本文介绍如何在Arduino上实现自己的Yeelink客户端,以便将采集到的传感器数据上传到Yeelink平台上.该 ...
- 使用 Chrome 浏览器插件 Web Scraper 10分钟轻松实现网页数据的爬取
web scraper 下载:Web-Scraper_v0.2.0.10 使用 Chrome 浏览器插件 Web Scraper 可以轻松实现网页数据的爬取,不写代码,鼠标操作,点哪爬哪,还不用考虑爬 ...
- Chrome 爬虫插件 Web Scraper
Web Scraper 官网:https://webscraper.io/ 有关webscraper的问题,看这个就够了(建议收藏): https://zhuanlan.zhihu.com/p/341 ...
- Web Scraper爬取信息
前期条件:安装web scraper插件: 安装好之后,打开网页调试模式,F12 会看到多出来Web Scraper: 实践: 以豆瓣网为例: 爬取租房信息: Type有很多类型: 这里选择是表格,需 ...
- 十分钟轻松学会python-10分钟轻松学会python turtle绘图
python2.6版本中后引入的一个简单的绘图工具,叫做海龟绘图(Turtle Graphics),turtle库是python的内部库,使用导入即可 import turtle 先说明一下turtl ...
- nodejs之简单的爬数据
nodejs 之简单爬数据 准备 cheerio 插件 cheerio 是一个为服务器特别定制的,快速.灵活.实施的 jQuery 核心实现方案. axios 插件 axios 是一个基于 promi ...
- webscraper多页爬取_数据收集:web scraper 多页(无规律url)抓取
前言 web scraper是一个很好用的Chrome爬虫插件,它易学易用,能够满足大部分需求,而且因为是基于浏览器渲染的,所以能回避很多反爬虫问题.另外,web scraper可以多开进程,对于一些 ...
最新文章
- Win64 驱动内核编程-15.回调监控注册表
- [MySQL优化案例]系列 -- 用TIMESTAMP类型取代INT和DATETIME
- 如何选择适合自己网站的防盗链
- Android使用SVG矢量图打造酷炫动效!
- Python3 爬虫实战 — 58同城武汉出租房【加密字体对抗】
- java中得到classpath和当前类的绝对路径的一些方法(路径中的%20进行替换空格)...
- IIS负载均衡-Application Request Route详解第二篇:创建与配置Server Farm(转载)
- 95-862-045-源码-runtime-blob-BlobService
- 异常:Invalid or unexpected token
- SpringBoot整合MyBatis后台分页前端BootstrapTable添加删除查看编辑搜索数据(二)
- 家政O2O要在寒冬下为用户创造体验春天
- 2017嵌入式软件行业现状及概述
- Rational rose 安装教程
- 矩阵转置---c语言实现
- 360免费wifi设置位置服务器,win10系统使用360免费wifi的操作方法
- 移动医疗APP的渠道策略
- Cache架构以及X86ARM @Linux平台cache eviction功能测试
- sublime匹配汉字
- Samsung/三星I9128 Galaxy Grand root教程_方法
- pytorch 中 利用自定义函数 get_mask_from_lengths(lengths, max_len)获取每个batch的mask
热门文章
- SQL Server无法以local 登陆问题的解决方法provider: Named Pipes Provider, error: 40 - Could not open a connection
- stm32+W5500+阿里物联网平台
- allegro如何快设置快捷键旋转器件
- ESP8266模块睡眠模式
- 云和恩墨荣获阿里云云合计划2021年度优秀伙伴技术先锋奖
- XZ_iOS 之各大银行URL Schemes
- 角色动画中的骨骼蒙皮技术
- C# 关于压缩、加密、解压问题
- 乔布斯逝去十年 苹果坠入凡间?
- 【leetcode】电话号码的字母组合