【利用EXCEL进行数据爬虫】数据爬虫学习
这篇文章是看了@小M姐姐呀~的一篇《利用EXCEL进行数据爬虫》,原理也很简单,以下是实践练习记录。
利用EXCEL进行数据爬虫https://blog.csdn.net/baidu_41833099/article/details/118196280小M姐姐呀~https://blog.csdn.net/baidu_41833099
首先这次我是用东方财富网的数据,个人也曾经是个小股民,喜欢看技术流多于热点事件,北向资金的流向也是在股票分析中比较重要的一个指标,这次就爬了一下北向资金近一年的持股数据-北向资金增持行业板块排行;沪深港通持股 _ 数据中心 _ 东方财富网
打开网站,打开F12(不同人的浏览器不同,我这里用的是搜狗),Ctrl+R刷新
这时会出现很多网站的文件,我们随便点击一个文件,找到下面的User-Agent,这个就是我们要找的东西,然后打开我们的office Excel(WPS不行,为此我还找了很多Excel的破解版,最终都还是试用期。。。)
点击数据-自网站
高级-填写以下信息,网址之类的。。。User-Agent就是我们刚刚要找的参数
点击确定,查看一下有没有你想要的表格,点击加载就可以导入到Excel表当中去
最后得到数据
THE END
其实还是比较初步的一个数据爬虫,不过还没在其他类型的网站上面实践过,不知道这套方法能不能适用。但没有学习Python的小伙伴用简单点的方法,成功爬出数据还是蛮有继续学习的动力的。感谢博主@小M姐姐呀~,希望她出更多爬虫技术分享小M姐姐呀~https://blog.csdn.net/baidu_41833099
【利用EXCEL进行数据爬虫】数据爬虫学习相关推荐
- 利用Excel函数对 重复数据进行编号解决方法
效果要求: 问题描述: 根据不同的类别(含重复数据)进行不同的编号排序,如上图所示 用法: sumproduct 在Sumproduct函数的适用范围,在给定的几组数组中,然后把数组间对应的元素相乘, ...
- 【汇总篇】如何利用Excel高效地处理数据
现将2017年的专栏"Power Query"汇总成PDF格式,便于学习管理. 链接:https://pan.baidu.com/s/14U2RZ9meSuHphDdyphEu0Q ...
- 利用Excel VBA实现批量数据分组转置
问题:如上图所示,按lon,lat分组,再进行转置. VBA代码: Sub admin()Dim conn, xRs, xFdSet conn = CreateObject("ADODB.C ...
- 利用Excel进行数据分析一(基础学习)
数据来源: https://pan.baidu.com/s/1PP9mY3b7XYPSoDS_AiFbPg 提取码:io6g 一.文本清洗函数 1.提取"7k-9k"中的最低和最高 ...
- 利用新浪API实现数据的抓取\微博数据爬取\微博爬虫
PS:(本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.由于微博接口更新后限制增大,这个代码已经不能用来爬 ...
- 利用新浪API实现数据的抓取\微博数据爬取\微博爬虫 1
PS:(本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.由于微博接口更新后限制增大,这个代码已经不能用来爬 ...
- Jsoup:使用Java将爬虫得到的数据写入Excel,Jsoup得到的数据进行持久化,爬虫数据保存到本地Excel中
Jsoup:使用Java将爬虫得到的数据写入Excel,Jsoup得到的数据进行持久化,爬虫数据保存到本地Excel中 一.资源 EasyExcel使用教程 Jsoup爬虫教程 二.代码 xml依赖 ...
- Python爬虫数据存储不同格式在excel表中通用代码
爬虫数据存储在excel表通用代码 一..xls格式 import xlwt #创建workbook对象 workbook = xlwt.Workbook(encoding='utf8') #添加sh ...
- Python电影爬虫,用Excel存储并进行数据可视化分析
目录 一.爬取网页数据 1.分析网页 (1)网页数据类型 (2)不同类型电影排行榜 url 的区别 电影分类对应关系表 2.编写爬虫 (1)先寻找网页的 url (2)编写请求中使用的相应数据 (3) ...
- python 爬虫抓取网页数据导出excel_Python爬虫|爬取起点中文网小说信息保存到Excel...
前言: 爬取起点中文网全部小说基本信息,小说名.作者.类别.连载\完结情况.简介,并将爬取的数据存储与EXCEL表中 环境:Python3.7 PyCharm Chrome浏览器 主要模块:xlwt ...
最新文章
- 深copy 和 浅copy 解析
- Makefile常用万能模板(包括静态链接库、动态链接库、可执行文件)
- 关于Mybatis的各种配置文件
- (NFS移植到arm上)编译portmap和nfs-utils
- CF#420 B. Okabe and Banana Trees 思维|暴力|几何
- Android功耗优化(7)---如何分析wakelock(wakeup source)持锁问题
- 6 华为交换机 路由配置_华为路由、交换机基础配置指令
- dell-inspiron-5439 uefi 黑苹果_follow me 跟我一起学黑苹果原版安装
- Q88:全局光照(Global Illumination)——Path Tracing算法生成反射焦散效果的图形
- 转载 java序列化与反序列化
- 全网首发:跟踪分析This parser does not support specification “null“ version “null“
- (附源码)springboot球鞋商城 毕业设计 011229
- 51单片机驱动8位数码管(74HC595驱动)滚动显示
- hz和分贝怎么转换_分贝换算(db换算公式)
- w10计算机用户名密码忘了,一招简单帮你解决win10系统电脑忘记开机密码
- 12.第十三章.合同管理
- 计算机专业买笔记本电脑游戏本还是商务本好,购买笔记本电脑,游戏本真的是第一选择吗?...
- STM32F407高级定时器-死区时间研究-STM32CubeMX
- Html 和 Css 的杂乱总结
- 今日multi_turtlebot3尝试