鉴于近几篇文章都与多周期回测相关,因此用这篇文章来记录下多周期股票的数据的获取方式。
前面在zwPython的框架下,使用的是Tushare来获取A股的日线数据,如果想获取其他周期的数据,就要使用Tushare Pro,并且还要有足够的积分。苦于家里没矿,手里没银子,转投向可以免费下载数据的BaoStock,以下简单记录数据下载流程。

安装

使用国内源安装:

pip install baostock -i https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host pypi.tuna.tsinghua.edu.cn

版本升级

pip install --upgrade baostock

使用前提

  • 安装Python

  • 安装pandas(pip install pandas)

数据时间范围说明

股票数据

  • 日、周、月K线数据,时间范围:1990-12-19至今。
  • 5、15、30、60分钟K线数据,时间范围:1999-07-26至今。

指数数据

  • 日、周、月K线已经包含指数:综合指数,规模指数,一级行业指数,二级行业指数,策略指数,成长指数,价值指数,主题指数,基金指数,债券指数。
  • 时间范围:2006-01-01至今。

季频财务数据

  • 已经包含的财务数据:部分上市公司资产负债信息、上市公司现金流量信息、上市公司利润信息、上市公司杜邦指标信息。
  • 时间范围:2007年至今。

季频公司报告

  • 上市公司业绩预告信息,时间范围:2003年至今。
  • 上市公司业绩快报信息,时间范围:2006年至今。

每日最新数据更新时间

  • 当前交易日17:30,完成日K线数据入库;
  • 当前交易日20:30,完成分钟K线数据入库;
  • 第二自然日1:30,完成前交易日“其它财务报告数据”入库。

A股K线数据下载

API

query_history_k_data_plus(code, fields, start_date=None, end_date=None, frequency='d', adjustflag='3')

参数含义

  • code:股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
  • fields:指示简称,支持多指标输入,以半角逗号分隔,填写内容作为返回类型的列。详细指标列表见历史行情指标参数章节,日线与分钟线参数不同。此参数不可为空;
  • start_date:开始日期(包含),格式“YYYY-MM-DD”,为空时取2015-01-01;
  • end_date:结束日期(包含),格式“YYYY-MM-DD”,为空时取最近一个交易日;
  • frequency:数据类型,默认为d,日k线;d=日k线、w=周、m=月、5=5分钟、15=15分钟、30=30分钟、60=60分钟k线数据,不区分大小写;指数没有分钟线数据;周线每周最后一个交易日才可以获取,月线每月最后一个交易日才可以获取;
  • adjustflag:复权类型,默认不复权:3;1:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权。

几点说明

  1. 可以通过query_all_stock(date)获取指定日期的指数和股票数据,提取指数和股票代码后,就可以用于后续的各周期数据的下载。如果只需要下载股票数据,而不需要下载指数数据,可以使用返回结果的code字段进行过滤。
  2. 使用文末所附代码下载各周期数据前,需要新建相应文件夹。
  3. 日线、周线和月线、分钟数据所能下载的数据字段不同,可根据需求选择下载字段。
  4. 股票停牌时,对于日线,开、高、低、收价都相同,且都为前一交易日的收盘价,成交量、成交额为0,换手率为空。因此,如果不需要这部分数据的话,需要进行数据过滤,删除volume为0的数据。此外,由于网络原因可能导致数据下载失败,引发访问volume字段时报错,因此需要做进一步条件判断处理,使下载程序能够继续执行。
        if DROP_SUSPENSION and 'volume' in list(out_df):out_df.drop(out_df[out_df.volume == '0'].index, inplace = True

使用BaoStock下载股票数据代码:

import baostock as bs
import pandas as pd
import datetime'''
日线指标参数包括:'date,code,open,high,low,close,preclose,volume,amount,adjustflag,turn,tradestatus,pctChg,peTTM,pbMRQ,psTTM,pcfNcfTTM,isST'
周、月线指标参数包括:'date,code,open,high,low,close,volume,amount,adjustflag,turn,pctChg'
分钟指标参数包括:'date,time,code,open,high,low,close,volume,amount,adjustflag'adjustflag:复权类型,默认不复权:3;1:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权。
'''# 是否删除停盘数据
DROP_SUSPENSION = Truedef update_stk_list(date = None):# 获取指定日期的指数、股票数据stock_rs = bs.query_all_stock(date)stock_df = stock_rs.get_data()stock_df.to_csv('./stk_data/all_list.csv', encoding = 'gbk', index = False)stock_df.drop(stock_df[stock_df.code < 'sh.600000'].index, inplace = True)stock_df.drop(stock_df[stock_df.code > 'sz.399000'].index, inplace = True)stock_df = stock_df['code']stock_df.to_csv('./stk_data/stk_list.csv', encoding = 'gbk', index = False)return stock_df.tolist()def load_stk_list():df = pd.read_csv('./stk_data/stk_list.csv')return df['code'].tolist()def convert_time(t):H = t[8:10]M = t[10:12]S = t[12:14]return H + ':' + M + ':' + Sdef download_data(stk_list = [], fromdate = '1990-12-19', todate = datetime.date.today(), datas = 'date,open,high,low,close,volume,amount,turn,pctChg', frequency = 'd', adjustflag = '2'):for code in stk_list:print("Downloading :" + code)k_rs = bs.query_history_k_data_plus(code, datas, start_date = fromdate, end_date = todate.strftime('%Y-%m-%d'),frequency = frequency, adjustflag = adjustflag)datapath = './stk_data/' + frequency + '/' + code + '.csv'out_df = k_rs.get_data()if DROP_SUSPENSION and 'volume' in list(out_df):out_df.drop(out_df[out_df.volume == '0'].index, inplace = True)# 做time转换if frequency in ['5', '15', '30', '60'] and 'time' in list(out_df):out_df['time'] = out_df['time'].apply(convert_time)out_df.to_csv(datapath, encoding = 'gbk', index = False)if __name__ == '__main__':bs.login()# 首次运行stk_list = update_stk_list(datetime.date.today() - datetime.timedelta(days = 31))# 非首次运行#stk_list = load_stk_list()# 下载日线download_data(stk_list)# 下载周线download_data(stk_list, frequency = 'w')# 下载月线download_data(stk_list, frequency = 'm')# 下载5分钟线download_data(stk_list, fromdate = '2020-6-1', frequency = '5', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')# 下载15分钟线download_data(stk_list, fromdate = '2020-6-1', frequency = '15', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')# 下载30分钟线download_data(stk_list, fromdate = '2020-6-1', frequency = '30', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')# 下载60分钟线download_data(stk_list, fromdate = '2020-6-1', frequency = '60', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')bs.logout()

欢迎大家关注、点赞、转发、留言,感谢支持!
为了便于相互交流学习,已建微信群,感兴趣的读者请加微信。

Python量化交易学习笔记(39)——BaoStock股票数据下载相关推荐

  1. Python量化交易学习笔记(1)

    Python量化交易学习笔记(1) http://zwpython.com/ http://www.topquant.vip/?p=2275 [更多参见] <zwPython,目前最好的py开发 ...

  2. 【python量化交易学习】pandas获取mysql数据,使用pyecharts画K线图,ma移动均线。

    将pyecharts官方提供的数据源,替换成已经存在mysql中的数据.画出专业的k线图(k线+ma移动均线+交易额柱状图(单位是千)) 参考: [python量化交易学习]pandas获取tusha ...

  3. Python量化交易学习笔记(21)——A股股票列表更新

    在zwPython2020中,股票数据下载更新时,所读取的股票列表文件的目录位置为"zwPython\TQDat\TQDown2020v1\data\tq_wrk_code.csv" ...

  4. python量化交易学习笔记_Python量化交易学习笔记(45)——深度学习挖短线股5

    前4篇文章分别记录了利用深度学习挖短线股的数据预处理.模型训练.结果预测及策略回测过程,本文记录根据筛选短线股票的过程. 选股流程 1.股票数据下载更新 例如现在是2020年11月23日19:00,我 ...

  5. Python量化交易学习笔记(45)——深度学习挖短线股5

    前4篇文章分别记录了利用深度学习挖短线股的数据预处理.模型训练.结果预测及策略回测过程,本文记录根据筛选短线股票的过程. 选股流程 1.股票数据下载更新 例如现在是2020年11月23日19:00,我 ...

  6. Python量化交易学习笔记(46)——通达信日线数据获取

    序 从2020年初开始接触量化,马上就要满一年了.在这一年里,想过去做量化,想过去做机器学习,想过去做少儿编程教育.就这样大概折腾了小半年时间,最后在CSDN上看到这样一句话:"你把时间投在 ...

  7. Python量化交易学习笔记(18)——放量突破布林线中轨买入策略

    本文将探索新的策略回测程序,主要是为了尝试不同的技术指标在backtrader平台上的应用,为后续复杂策略的实现做准备. 本文将实现的策略是,当股票放量突破布林线中轨时进行买入,当股票收盘价低于短期均 ...

  8. Python量化交易学习笔记(33)——backtrader仓位管理

    本文将对backtrader的仓位管理进行介绍,具体以同时回测交易3只股票为例,查看每日仓位情况. 策略 买入条件:5日线金叉60日线 卖出条件:5日线死叉60日线 示例 仓位信息输出的核心代码位于策 ...

  9. Python量化交易学习笔记(2)——A股数据下载

    由于笔者只接触过A股交易,因此本系列笔记仅针对A股交易展开.笔者的计算机为Windows 10 64位操作系统. TOP极宽量化总群(124134140)群文件中提供了大量的学习资料,一眼看去有点懵圈 ...

  10. Python量化交易学习笔记(36)——backtrader多股回测避坑3

    本文继续记录多股回测时可能遇到的异常情况. 坑描述 多股回测时,当日期达到所有股票的技术指标都能够计算出有效值后,backtrader才开始进行回测.由于这种逻辑的存在,如果某些股票在回测周期的最后几 ...

最新文章

  1. C语言中整型在计算机中的存储
  2. 转 Java的各种打包方式(JAR/WAR/EAR/CAR)
  3. 进入保护模式(四)设置一些公用的方法
  4. biostar handbook: 第一周笔记汇总+第二周任务布置
  5. 给大家推荐一个优质Linux内核技术公众号-Linux阅码场
  6. 11.04.30 半夜清晨
  7. slope one算法matlab,求助我这个寻峰算法该怎么提高灵敏度
  8. Quartus II调用modelsim ALTEA 的软件使用及问题
  9. (转)马云又在押宝智能投顾!
  10. 【前端】相信你会用到的一篇笔记---CSS篇(2)
  11. oracle报03113,一条SQL查询,报ora-03113的错误,请高手分析
  12. 想要Linux上云?如何实现Linux工作流上云部署
  13. 雷特智能家居龙海祁:从专业调光到全宅智能,20年专注成就专业
  14. 【MySQL】MySQL 存储引擎、索引、锁、集群
  15. 新生研讨课:利用OpenCV处理带有水印的图片的调研报告
  16. 小米路由器刷Xiaomi Mi WiFi Mini openwrt
  17. canva五角星空html,使用canvas绘制一个五角星
  18. java中把gui插入图片_在java中使用图片实现gui的美化.pdf
  19. WOS(五)——字段标识
  20. Python之爬虫 搭建代理ip池

热门文章

  1. 微信云支付so seay
  2. 线性代数同济第六版笔记:1-行列式
  3. Qimage Ultimate 2021(图片批量打印工具)官方正式版V2021.104 | 终极批量图片打印软件
  4. 学成在线案例(开发具体步骤)
  5. 《挑战程序设计竞赛》 读后感
  6. cad的dwg文件转html文件,DWG格式CAD文件如何转为图片上传到网页?
  7. window使用fliqlo 教程
  8. VB6.0处理WPS个人免费版代码
  9. 如何使用SPSS进行计算变量的操作
  10. ztree 右键菜单功能