用Excel,只需30秒就可爬取网站数据
是的,你没看错,就是用Excel爬数据。那么为什么要用它呢?因为它不需要写一行代码,只需要轻轻点几下鼠标,就可以得到你想要的数据,全程30秒左右就能搞定,在网站结构简单,需求比较简单的情况下,你只此一招就可以秒杀专业程序员,毕竟很多时候30秒恐怕程序员才刚刚打开专业代码编辑器,等待各种组件插件加载完成。哈哈哈~~~~,怎么样心动了吗?
0. 软件版本要求及先决条件
要求1 :Excel2016及以上版本,开箱即用。当然其他低版本,不是不可以,只是需要自己安装插件,爱折腾的可以自己尝试。
要求2:仅支持get请求(这一点不了解的人可以不管,可以简单的认为是那种你直接打开就能看到 的数据就是满足要求的)
要求3:你所需要的数据,在html网页的table标签中。不能是图片等。
那么如何知道是否在table标签中呢?很简单只需要在浏览器中看一下网页源代码,你需要的数据是否被包裹在(<td>数据</td> 或<th>数据</th>)这样的结构中,如果是,恭喜你,excel直接可以抓取,如果不是,那就用其他更专业的爬虫工具或者自己老老实实写代码吧。。。
下面展示一下查看数据是否在<td>(或<th>)标签中的操作:(随便找了个房价网站)
a. 浏览器打开网站,找到想要爬取的数据,按下键盘上的“F12”键(推荐使用谷歌浏览器、Edge浏览器、火狐浏览器),打开调试器。
b. 点击左上角的元素定位图标,然后将鼠标移动到你需要的数据上,就可以看到他们是否包含在<td>(<th>)中了。
上面的过程,是分析网站数据结构的过程,可以看到所需数据都包含在<th>标签中,这个过程是不可或缺的,不管你是利用工具爬取还是自己写代码爬取,这个过程极其重要。
假设你确定了,你想要的数据正好就在<td>(<th>)标签中,那么下面就看如何利用Excel爬取吧!
1. 打开Excel数据获取工具
注:不同版本可能组件的名称或位置略有差异,我这里是Excel2019版,其他版本对比查找一下,确定的是都在“数据”这个选项卡下面。
2. 填写爬取参数
这是基本模式,只需要把你要爬的网页网址粘贴过来即可,另一种高级模式可以设置更多的参数,比如请求头这些,有兴趣的可以自己探索。
注:不需要登录的网站直接匿名模式就可以
3. 获取数据
在该界面,选择需要的table点击,然后点击转换数据,就可以调用excel自带的power BI对数据进行各种自定义的处理转换,当然也可以直接加载,如果你不想做过多的转换或是想在excel中再处理的话。
下面的界面就是power query的界面,可以在这个界面进行各种高级的数据转换,也可以不操作, 假设你转换完了,直接点击“关闭并上载”即可。
OK , 想要的数据已经上载到excel中了,就是这么方便快捷。
今天的经验分享就到这里啦,有好的意见或建议,欢迎在评论区留言~~~~
用Excel,只需30秒就可爬取网站数据相关推荐
- 合并excel文件 C语言,再见Ctrl + C!合并100个Excel表格,只需30秒!
原标题:再见Ctrl + C!合并100个Excel表格,只需30秒! 哈喽,大家好!在上篇文章< 你复制粘贴的那么认真,难怪天天加班[Excel教程] >中,我们给大家介绍了4种拆分工作 ...
- 应用悄悄拿走你的隐私做了什么?只需30秒这个AI给你答案
安妮 编译自 Futurism 量子位 出品 | 公众号 QbitAI "我已经阅读并了解--"可能是当代青年定期撒下的一个谎. 可能你深有体会. 几乎每个下载的App都有用户协议 ...
- 微信哪个电话能转人工服务器,如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效...
原标题:如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效 很多人都会使用微信,但是使用过程中难免会遇到问题,比如账号封号.转错账.支付问题等.如果在机器人自动回答中解决不了问题,想找人工客 ...
- 如何接通qq人工语音服务器,如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效...
原标题:如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效 很多人都会使用微信,但是使用过程中难免会遇到问题,比如账号封号.转错账.支付问题等.如果在机器人自动回答中解决不了问题,想找人工客 ...
- 用Excel,爬取网站数据
0. 软件版本要求及先决条件 要求1 :Excel2016及以上版本,开箱即用.当然其他低版本,不是不可以,只是需要自己安装插件,爱折腾的可以自己尝试. 要求2:仅支持get请求(这一点不了解的人可以 ...
- 使用python爬取网站数据并写入到excel中
文章目录 前言 一.使用python爬取网上数据并写入到excel中 例子一: 例子二: 二.工具类 总结 前言 记录一下使用python将网页上的数据写入到excel中 一.使用python爬取网上 ...
- 用python爬取网站数据到excel
```python from bs4 import BeautifulSoup from urllib import request import xlwt#获取数据 value=1 while va ...
- Python爬取网站数据并生成Excel
# -*- coding: utf-8 -*- import os import re import sys import ssl import json import time import xlw ...
- Pyhton如何爬取网站数据并导入到excel
一.环境 1.pycharm 2.python3.7 二.功能 通过获取Redmine(管理系统软件) XXX项目列表来获取对应项目的名称,并输出到Excel 三.开发步骤 好,正式开始: 第一步: ...
最新文章
- R语言cut函数实现数据分箱及因子化实战
- 【AIX 命令学习】加载与卸载文件系统!
- 博士发公众号文章也能评国奖?双一流高校新规引热议!
- 零基础学Java编程一定要上Java培训机构吗
- 使用Hash碰撞进行DoS攻击
- 2021牛客暑期多校训练营9
- 随手练——洛谷-P1008 / P1618 三连击(暴力搜索)
- 线性结构 —— 单调栈与单调队列
- 重新认识C#: 玩转指针
- ROS学习笔记—— tf 工具包介绍
- plc仿真实训软件_多专业综合仿真实训K3使用教程
- 计算机组成原理期末考试题库(超级多的那种)
- AirServer 7win/mac手机投屏到电脑工具
- 通过USB设置手机连接电脑上网
- 基于MySQL毕业设计题目50例
- 荒岛求生html5小游戏在线玩,荒岛求生
- 批量将多个 Excel 工作簿文件拆分成单个 Excel 工作簿文件
- python27安装get-pip
- word打开doc文件提示运行时错误‘4605‘
- 电脑硬盘就一个c盘怎么分区,新电脑买回来只有一个c盘怎么分区