说到从网上抓取数据,大多数人马上想到的就是Python,但是有的时候不用Python也可以搞定。今天给大家分享一篇如何利用Excel抓取网站上我们所需要的多页数据。

如抓取新浪财经股票页面中的2019年度上市企业的营利能力的前10页的数据。网站截图如下图所示:

网址为:

http://vip.stock.finance.sina.com.cn/q/go.php/vFinanceAnalyze/kind/profit/index.phtml?s_i=&s_a=&s_c=&reportdate=2019&quarter=1

Power  Query(以下简称:PQ)是Excel的另一个十分强大的功能,是以后学习Excel必备的功能。

首先大家需要了解的是:Excel Power Query是微软在Excel2016版本及以上内置的一个数据获取与处理的功能。功能所在菜单为:

在Excel2010版本与Excel2013版本中需要从微软的官网上下载安装。在Excel2007及以下的版本中是无法使用的。WPS也无法使用。

抓取的结果如下表所示(局部):

这样的结果怎么样快速地可以使用Excel软件来完成呢,说起来可能大家不信,但是就是十分地简单,可能连2分钟也花不上就可以轻松地抓取出来。

请跟着小必老师一起来看下面的抓取过程


喜欢文章的话,点个“在看”哦

【视频教程】利用Excel轻松爬取网页上的数据相关推荐

  1. python每隔一段时间保存网页内容_利用Python轻松爬取网页题库答案!教孩子不怕尴尬了!...

    大家有没有遇到这种令人尴尬的情况:"好不容易在网上找到需要的资源数据,可是不容易下载下来!"如果是通过一页一页的粘贴复制来下载,真的让人难以忍受,特别是像我这种急性子,真得会让人窒 ...

  2. python爬取学校题库_利用Python轻松爬取网页题库答案!教孩子不怕尴尬了!

    大家有没有遇到这种令人尴尬的情况:"好不容易在网上找到需要的资源数据,可是不容易下载下来!"如果是通过一页一页的粘贴复制来下载,真的让人难以忍受,特别是像我这种急性子,真得会让人窒 ...

  3. python java 爬数据_如何用java爬虫爬取网页上的数据

    当我们使用浏览器处理网页的时候,有时候是不需要浏览的,例如使用PhantomJS适用于无头浏览器,进行爬取网页数据操作.最近在进行java爬虫学习的小伙伴们有没有想过如何爬取js生成的网络页面吗?别急 ...

  4. 使用java爬取网页上的数据

    要爬的网页:https://list.jd.com/list.html?cat=9987,653,655&page=1&sort=sort_rank_asc&trans=1&a ...

  5. 利用脚本动态爬取网页信息

    利用脚本动态爬取网页信息 编译环境:Jupyter Notebook (Anaconda3) 调用的包:selenium,webdrive,webdriver_manager 文章目录 利用脚本动态爬 ...

  6. 利用CSS选择器爬取豆瓣上的图书

    利用CSS选择器爬取豆瓣上的图书 主要技术:熟练掌握requests.BeautifulSoup 爬取图书链接 "https://book.douban.com/latest?icn=ind ...

  7. 【期末课设】python爬虫基础与可视化,使用python语言以及支持python语言的第三方技术实现爬虫功能,定向爬取网页的图片数据,并且实现批量自动命名分类下载。

    1.大作业的内容 本要求使用python语言以及支持python语言的第三方技术实现爬虫功能,定向爬取网页的图片数据,并且实现批量自动命名分类下载. 2.案例需求 要求采用虚拟浏览器等动态爬虫技术,完 ...

  8. 爬虫批量保存网页html,2分钟带你学会网络爬虫:Excel批量爬取网页数据(详细图文版)...

    面对网页大量的数据,有时候还要翻页,你还在一页一页地复制粘贴吗?别人需要几小时完成的任务,学会这个小技巧你只需要几分钟就能解决.快来学习使用Excel快速批量地爬取网页数据吧! 1.分析网页数据结构 ...

  9. python爬虫爬取网页上的天气数据

    目录 一:获取网页重要信息 二:爬取网页数据 三:源码分享 一:获取网页重要信息 在要爬取数据信息的网页上,F12进入查看网页内容 二:爬取网页数据 1 导入模块 import requests fr ...

最新文章

  1. 134个预训练模型、精度高达85.1%,百度视觉算法最强基石PaddleClas全新升级
  2. LGDT/LIDT - 加载全局/中断描述符表格寄存器
  3. 分布式防火墙技术及主要特点
  4. HOW-TO:带有Spring MVC的Tomcat中的自定义错误页面
  5. UpdatePanel 属性学习之 UpdateMode
  6. [案例]某体育用品公司在零售领域BI的产品应用解决方案
  7. 数值作业:改进欧拉法求常微分方程C语言代码
  8. 实验一 9V稳压电源电路实验
  9. Java中类与对象编程题
  10. Linux snapcraft vscode报错snap is unusable due to missing files解决方法
  11. maya表情blendshape_引用 【Maya】角色表情绑定-BlendShape的使用技巧
  12. 【解决】ubuntu桌面无法进入问题
  13. 四川省工程技术研究中心申报解读(条件认定流程各市奖励政策)
  14. 10周拿下腾讯数据分析师认证
  15. 鉴源实验室丨汽车电子架构和CAN网络基础
  16. JetBrains所有IDE和.NET 工具 V2022.1全面升级
  17. 热门光学软件之初体验网络课程系列大纲8
  18. Selenium 实现淘宝自动化添加购物车
  19. 安卓源码google安卓设备OTA升级包及工厂镜像下载
  20. 5.从键盘接收一百分制成绩 (0~100)

热门文章

  1. linux随机自启命令,linux设置开机自启动
  2. mysql bitmap redis_Redis中bitmap的妙用
  3. Java---报错The type List is not generic; it cannot be parameterized with arguments <Role>==List打包错误
  4. C/C++ 动态存储分配 malloc calloc realloc函数的用法与区别
  5. Javascript权威指南——第一章Javascript概述
  6. Visual Studio 2008 Windows Server 2008 预发布-20日在南宁
  7. UML模型中的图-行为图【交互图-序列图、协作图】
  8. Educational Round 64 题解
  9. 2018-2019-2 20175305实验一《Java开发环境的熟悉》实验报告
  10. Linux平台搭建roboframework