Python 爬虫 | 获取历史涨停数据
最近想研究一下连板的个股有没有什么规律(暴富我来了),这一篇主要就是做数据准备的。
目录
1、数据获取
2、代码实现
1、数据获取
数据来源就是问财,查指定日期的涨停即可获得当日的数据。
2、代码实现
代码我是在——Python 爬虫 | 获取涨停原因的代码基础上进行修改得到的。
第一步:我们需要获取交易日期
第二步:不断修改关键词去请求得到数据
一开始做第一步的时候我是自己写逻辑去判断交易日,后面才醒悟过来我直接爬指数的数据从中剥离出日期数据就好了,方便又快捷。
this_year = get_standard_date(timestamp=time.time(), mode='%Y%m%d')[:4]
def get_trading_day(start_year=this_year):
这里我就讲一下方法get_trading_day的参数start_year,这个参数是意思是你想要那年开始的数据,我这里默认它为运行程序时所在的年份。其它代码都很简单我这里就不过多赘述了,有需要的回复“历史涨停数据”即可获取代码及数据。
注意:
代码写完后我在测试的时候发现一个问题,这个程序跑一段时间网站返回的数据就是错误的了导致程序报错。但是当程序报错的时候你立刻启动程序又可以正常运行了。头疼不知道什么问题。
为此我将跑过的日期跳过,哪里停止就从那重新开始爬。因此你跑程序的时候出现了报错只需重新启动一遍程序即可。
Python 爬虫 | 获取历史涨停数据相关推荐
- [遥感]利用python爬虫获取美国冰雪数据中心的数据
00. 写在前面: 由于最近学习方面需要用到NSIDC(美国冰雪数据中心)的数据进行计算,但是手工下载又特别耗费时间,需要一个一个去点击,所以我尝试着去写一个小爬虫获取所需数据. 对所有需要在NSID ...
- 【python】获取历史天气数据
记录一下我的python学习之路 今天没有使用爬虫获取数据,而是根据目标网页的数据特点,选用pd.read_html()读取网页表格类数据. 目录 前期准备 完整代码 代码浅析 欢迎相互学习 前期准备 ...
- 我是如何把python爬虫获取到的数据写入Excel的?
如何将爬虫获取的数据写入Excel,这一点我在爬虫文章几乎都是采用这种方式来进行操作的 写入Excel的目的是为了后续更加方便的使用pandas对数据进行清洗.筛选.过滤等操作. 为进一步数据研究.可 ...
- python爬虫获取历史天气信息
想要获得一个城市的历史天气,可以在天气后报网站上查询获得 如果要通过大量历史天气数据做分析,可以通过爬虫的方式获得. 如,我们要查询北京2020年9月的天气汇总.可以看到网站界面如图所示 要爬取这个列 ...
- python爬虫获取的网页数据为什么要加[0-python3爬虫爬取网页思路及常见问题(原创)...
学习爬虫有一段时间了,对遇到的一些问题进行一下总结. 爬虫流程可大致分为:请求网页(request),获取响应(response),解析(parse),保存(save). 下面分别说下这几个过程中可以 ...
- python爬虫获取并购重组数据
##并购重组数据爬取案例 1.寻找并购数据网址,网址见案例代码: 2.分析数据在网页上存在的形式.例如本文:每次跳转页面,都会发送一个请求,返回一个Json格式的结果.我们可以看到json里面的数据就 ...
- python爬虫获取的网页数据为什么要加[0-[Python爬虫] 等待网页加载后再获取内容...
0x0 背景 最近在学习Python爬虫的相关知识,主要是之前有一个小idea想要用Python实现,沉寂了一年,近期终于下定决心要利用假期时间首要解决此项任务,不然拖到最后都没完成,自己遗憾不说,还 ...
- 利用python爬虫获取豆瓣读书数据建立书单
0. 写在前面 网络爬虫: A Web crawler, sometimes called a spider, is an Internet bot that systematically brows ...
- python爬虫获取的网页数据为什么要加[0-python爬虫解析页面数据的三种方式
re模块 re.S表示匹配单行 re.M表示匹配多行 使用re模块提取图片url,下载所有糗事百科中的图片 普通版 import requests import re import os if not ...
最新文章
- 【网络流】【Dinic】【Next Array】Dinic模板
- MySQL5.6优化了Order by排序limit
- [JSON].getObj( keyPath )
- React系列--jsx语法及虚拟dom,渲染
- win7字体大小怎么设置_XP,win7系统怎么设置自动关机
- 中国最经典广告语大全
- session超时以及销毁
- 免费中文版Adobe Acrobat Reader DC PDF文件阅读软件
- 使用CME2配置Copley驱动器,带Maxon电机
- Sigma Function LightOJ - 1336
- 信息流广告如何操作?(含CPC、OCPC、CPM、eCPM、CTR等)
- telnet客户端 端口23失败
- IPSEC协议及当中IKE协商加解密原理
- java多线程并发基础汇总一
- 电脑计算机软件硬盘不足,电脑提示磁盘空间不足怎么办
- #ASM 翻译系列第三十二弹:ASM INTERNAL Find block in ASM
- VS2010安装Visual Assist X
- pygame 等有缘人接盘
- 欧美企业必备技能-Mockito
- php边框圆角,Html实现边框圆角的实例详解
热门文章
- AG9311/AG9310 Type-C转HDMI设计方案|替代AG9310/AG9311芯片|GSV2201可完全替代兼容AG9310/AG9311
- DeepLab系列理解
- Android Studio报错:No key with alias xxx found in keystore xxx 解决方法
- 【18/M/python】4Sum
- 尚好房 07_前端房源展示
- Tekton实战案例--S2I
- 浏览器不能把文件下载到D盘
- python pyqt5教程pdf_PyQt5 从零开始制作 PDF 阅读器(一)
- 物联网跟人的神经网络相似通过各种信息传感设备
- HDU6194 后缀数组的应用