是的,你没看错,就是用Excel爬数据。那么为什么要用它呢?因为它不需要写一行代码,只需要轻轻点几下鼠标,就可以得到你想要的数据,全程30秒左右就能搞定,在网站结构简单,需求比较简单的情况下,你只此一招就可以秒杀专业程序员,毕竟很多时候30秒恐怕程序员才刚刚打开专业代码编辑器,等待各种组件插件加载完成。哈哈哈~~~~,怎么样心动了吗?

0. 软件版本要求及先决条件

要求1 :Excel2016及以上版本,开箱即用。当然其他低版本,不是不可以,只是需要自己安装插件,爱折腾的可以自己尝试。

要求2:仅支持get请求(这一点不了解的人可以不管,可以简单的认为是那种你直接打开就能看到 的数据就是满足要求的)

要求3:你所需要的数据,在html网页的table标签中。不能是图片等。

那么如何知道是否在table标签中呢?很简单只需要在浏览器中看一下网页源代码,你需要的数据是否被包裹在(<td>数据</td> 或<th>数据</th>)这样的结构中,如果是,恭喜你,excel直接可以抓取,如果不是,那就用其他更专业的爬虫工具或者自己老老实实写代码吧。。。

下面展示一下查看数据是否在<td>(或<th>)标签中的操作:(随便找了个房价网站)

a.  浏览器打开网站,找到想要爬取的数据,按下键盘上的“F12”键(推荐使用谷歌浏览器、Edge浏览器、火狐浏览器),打开调试器。

b. 点击左上角的元素定位图标,然后将鼠标移动到你需要的数据上,就可以看到他们是否包含在<td>(<th>)中了。

上面的过程,是分析网站数据结构的过程,可以看到所需数据都包含在<th>标签中,这个过程是不可或缺的,不管你是利用工具爬取还是自己写代码爬取,这个过程极其重要。

假设你确定了,你想要的数据正好就在<td>(<th>)标签中,那么下面就看如何利用Excel爬取吧!

1. 打开Excel数据获取工具

 注:不同版本可能组件的名称或位置略有差异,我这里是Excel2019版,其他版本对比查找一下,确定的是都在“数据”这个选项卡下面。

2. 填写爬取参数

这是基本模式,只需要把你要爬的网页网址粘贴过来即可,另一种高级模式可以设置更多的参数,比如请求头这些,有兴趣的可以自己探索。

注:不需要登录的网站直接匿名模式就可以

3. 获取数据

在该界面,选择需要的table点击,然后点击转换数据,就可以调用excel自带的power BI对数据进行各种自定义的处理转换,当然也可以直接加载,如果你不想做过多的转换或是想在excel中再处理的话。

下面的界面就是power query的界面,可以在这个界面进行各种高级的数据转换,也可以不操作, 假设你转换完了,直接点击“关闭并上载”即可。

OK , 想要的数据已经上载到excel中了,就是这么方便快捷。

今天的经验分享就到这里啦,有好的意见或建议,欢迎在评论区留言~~~~

用Excel,只需30秒就可爬取网站数据相关推荐

  1. 合并excel文件 C语言,再见Ctrl + C!合并100个Excel表格,只需30秒!

    原标题:再见Ctrl + C!合并100个Excel表格,只需30秒! 哈喽,大家好!在上篇文章< 你复制粘贴的那么认真,难怪天天加班[Excel教程] >中,我们给大家介绍了4种拆分工作 ...

  2. 应用悄悄拿走你的隐私做了什么?只需30秒这个AI给你答案

    安妮 编译自 Futurism 量子位 出品 | 公众号 QbitAI "我已经阅读并了解--"可能是当代青年定期撒下的一个谎. 可能你深有体会. 几乎每个下载的App都有用户协议 ...

  3. 微信哪个电话能转人工服务器,如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效...

    原标题:如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效 很多人都会使用微信,但是使用过程中难免会遇到问题,比如账号封号.转错账.支付问题等.如果在机器人自动回答中解决不了问题,想找人工客 ...

  4. 如何接通qq人工语音服务器,如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效...

    原标题:如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效 很多人都会使用微信,但是使用过程中难免会遇到问题,比如账号封号.转错账.支付问题等.如果在机器人自动回答中解决不了问题,想找人工客 ...

  5. 用Excel,爬取网站数据

    0. 软件版本要求及先决条件 要求1 :Excel2016及以上版本,开箱即用.当然其他低版本,不是不可以,只是需要自己安装插件,爱折腾的可以自己尝试. 要求2:仅支持get请求(这一点不了解的人可以 ...

  6. 使用python爬取网站数据并写入到excel中

    文章目录 前言 一.使用python爬取网上数据并写入到excel中 例子一: 例子二: 二.工具类 总结 前言 记录一下使用python将网页上的数据写入到excel中 一.使用python爬取网上 ...

  7. 用python爬取网站数据到excel

    ```python from bs4 import BeautifulSoup from urllib import request import xlwt#获取数据 value=1 while va ...

  8. Python爬取网站数据并生成Excel

    # -*- coding: utf-8 -*- import os import re import sys import ssl import json import time import xlw ...

  9. Pyhton如何爬取网站数据并导入到excel

    一.环境 1.pycharm 2.python3.7 二.功能 通过获取Redmine(管理系统软件) XXX项目列表来获取对应项目的名称,并输出到Excel 三.开发步骤 好,正式开始: 第一步: ...

最新文章

  1. R语言cut函数实现数据分箱及因子化实战
  2. 【AIX 命令学习】加载与卸载文件系统!
  3. 博士发公众号文章也能评国奖?双一流高校新规引热议!
  4. 零基础学Java编程一定要上Java培训机构吗
  5. 使用Hash碰撞进行DoS攻击
  6. 2021牛客暑期多校训练营9
  7. 随手练——洛谷-P1008 / P1618 三连击(暴力搜索)
  8. 线性结构 —— 单调栈与单调队列
  9. 重新认识C#: 玩转指针
  10. ROS学习笔记—— tf 工具包介绍
  11. plc仿真实训软件_多专业综合仿真实训K3使用教程
  12. 计算机组成原理期末考试题库(超级多的那种)
  13. AirServer 7win/mac手机投屏到电脑工具
  14. 通过USB设置手机连接电脑上网
  15. 基于MySQL毕业设计题目50例
  16. 荒岛求生html5小游戏在线玩,荒岛求生
  17. 批量将多个 Excel 工作簿文件拆分成单个 Excel 工作簿文件
  18. python27安装get-pip
  19. word打开doc文件提示运行时错误‘4605‘
  20. 电脑硬盘就一个c盘怎么分区,新电脑买回来只有一个c盘怎么分区

热门文章

  1. KD tree (K dimensional tree)多维空间搜索 近邻
  2. nbu Linux 邮件告警,NBU常用命令1——介质管理
  3. Java实现 蓝桥杯 算法提高 扶老奶奶过街
  4. OmniPlan-Mac上使用的项目管理软件
  5. String存放在堆中还是栈中?5年的Java照样说不清楚!
  6. IntelliJ IDEA剪切复制快捷键 失效解决方案
  7. 耀耀学院task1-task3练习总结
  8. Ubuntu18.04安装evo及简单使用方法
  9. 如何在mac上输入无穷大infinity符号:∞
  10. docker里面pytorch关于gloo地址声明