这篇文章是看了@小M姐姐呀~的一篇《利用EXCEL进行数据爬虫》,原理也很简单,以下是实践练习记录。

利用EXCEL进行数据爬虫https://blog.csdn.net/baidu_41833099/article/details/118196280小M姐姐呀~https://blog.csdn.net/baidu_41833099

首先这次我是用东方财富网的数据,个人也曾经是个小股民,喜欢看技术流多于热点事件,北向资金的流向也是在股票分析中比较重要的一个指标,这次就爬了一下北向资金近一年的持股数据-北向资金增持行业板块排行;沪深港通持股 _ 数据中心 _ 东方财富网

打开网站,打开F12(不同人的浏览器不同,我这里用的是搜狗),Ctrl+R刷新

这时会出现很多网站的文件,我们随便点击一个文件,找到下面的User-Agent,这个就是我们要找的东西,然后打开我们的office Excel(WPS不行,为此我还找了很多Excel的破解版,最终都还是试用期。。。)

点击数据-自网站

高级-填写以下信息,网址之类的。。。User-Agent就是我们刚刚要找的参数

点击确定,查看一下有没有你想要的表格,点击加载就可以导入到Excel表当中去

最后得到数据

THE END

其实还是比较初步的一个数据爬虫,不过还没在其他类型的网站上面实践过,不知道这套方法能不能适用。但没有学习Python的小伙伴用简单点的方法,成功爬出数据还是蛮有继续学习的动力的。感谢博主@小M姐姐呀~,希望她出更多爬虫技术分享小M姐姐呀~https://blog.csdn.net/baidu_41833099

【利用EXCEL进行数据爬虫】数据爬虫学习相关推荐

  1. 利用Excel函数对 重复数据进行编号解决方法

    效果要求: 问题描述: 根据不同的类别(含重复数据)进行不同的编号排序,如上图所示 用法: sumproduct 在Sumproduct函数的适用范围,在给定的几组数组中,然后把数组间对应的元素相乘, ...

  2. 【汇总篇】如何利用Excel高效地处理数据

    现将2017年的专栏"Power Query"汇总成PDF格式,便于学习管理. 链接:https://pan.baidu.com/s/14U2RZ9meSuHphDdyphEu0Q ...

  3. 利用Excel VBA实现批量数据分组转置

    问题:如上图所示,按lon,lat分组,再进行转置. VBA代码: Sub admin()Dim conn, xRs, xFdSet conn = CreateObject("ADODB.C ...

  4. 利用Excel进行数据分析一(基础学习)

    数据来源: https://pan.baidu.com/s/1PP9mY3b7XYPSoDS_AiFbPg 提取码:io6g 一.文本清洗函数 1.提取"7k-9k"中的最低和最高 ...

  5. 利用新浪API实现数据的抓取\微博数据爬取\微博爬虫

    PS:(本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.由于微博接口更新后限制增大,这个代码已经不能用来爬 ...

  6. 利用新浪API实现数据的抓取\微博数据爬取\微博爬虫 1

    PS:(本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.由于微博接口更新后限制增大,这个代码已经不能用来爬 ...

  7. Jsoup:使用Java将爬虫得到的数据写入Excel,Jsoup得到的数据进行持久化,爬虫数据保存到本地Excel中

    Jsoup:使用Java将爬虫得到的数据写入Excel,Jsoup得到的数据进行持久化,爬虫数据保存到本地Excel中 一.资源 EasyExcel使用教程 Jsoup爬虫教程 二.代码 xml依赖 ...

  8. Python爬虫数据存储不同格式在excel表中通用代码

    爬虫数据存储在excel表通用代码 一..xls格式 import xlwt #创建workbook对象 workbook = xlwt.Workbook(encoding='utf8') #添加sh ...

  9. Python电影爬虫,用Excel存储并进行数据可视化分析

    目录 一.爬取网页数据 1.分析网页 (1)网页数据类型 (2)不同类型电影排行榜 url 的区别 电影分类对应关系表 2.编写爬虫 (1)先寻找网页的 url (2)编写请求中使用的相应数据 (3) ...

  10. python 爬虫抓取网页数据导出excel_Python爬虫|爬取起点中文网小说信息保存到Excel...

    前言: 爬取起点中文网全部小说基本信息,小说名.作者.类别.连载\完结情况.简介,并将爬取的数据存储与EXCEL表中 环境:Python3.7 PyCharm Chrome浏览器 主要模块:xlwt ...

最新文章

  1. 深copy 和 浅copy 解析
  2. Makefile常用万能模板(包括静态链接库、动态链接库、可执行文件)
  3. 关于Mybatis的各种配置文件
  4. (NFS移植到arm上)编译portmap和nfs-utils
  5. CF#420 B. Okabe and Banana Trees 思维|暴力|几何
  6. Android功耗优化(7)---如何分析wakelock(wakeup source)持锁问题
  7. 6 华为交换机 路由配置_华为路由、交换机基础配置指令
  8. dell-inspiron-5439 uefi 黑苹果_follow me 跟我一起学黑苹果原版安装
  9. Q88:全局光照(Global Illumination)——Path Tracing算法生成反射焦散效果的图形
  10. 转载 java序列化与反序列化
  11. 全网首发:跟踪分析This parser does not support specification “null“ version “null“
  12. (附源码)springboot球鞋商城 毕业设计 011229
  13. 51单片机驱动8位数码管(74HC595驱动)滚动显示
  14. hz和分贝怎么转换_分贝换算(db换算公式)
  15. w10计算机用户名密码忘了,一招简单帮你解决win10系统电脑忘记开机密码
  16. 12.第十三章.合同管理
  17. 计算机专业买笔记本电脑游戏本还是商务本好,购买笔记本电脑,游戏本真的是第一选择吗?...
  18. STM32F407高级定时器-死区时间研究-STM32CubeMX
  19. Html 和 Css 的杂乱总结
  20. 今日multi_turtlebot3尝试

热门文章

  1. arcgis悬挂点修改_ArcGIS拓扑编辑修正点位置的问题
  2. 惠普ELITE X2 1012 G1平板拆机记录
  3. 会考计算机辅助制图,信息技术会考基础知识
  4. ADC学习(4)—— 电压比较器
  5. java万能万年历的程序_Java编写多功能万年历程序的实例分享
  6. javaSE(完整版)
  7. 算法设计与分析复习大纲
  8. IE8卸载再回到IE6
  9. AR as a civil right
  10. 厦大计算机学院2018夏令营6,2018年厦门大学建筑与土木工程学院保研夏令营通知...