量化交易之股票数据的获取——同花顺软件 1
前言
数据是进行量化交易的基础和关键,目前国内做量化产品的金融机构大部分是从券商获取高频实时行情数据的,另外很多金融网站也提供了数据接口,可以调用接口方式获取,也可以用爬虫的方式获取。文本讲述一种更经济便捷的方式来获取数据,即通过同花顺交易软件来导出股票数据,并且将数据转换为DataFrame 表格型的数据结构,以csv的格式存储,便于后续进行量化交易分析。
同花顺交易数据导出
1.打开同花顺软件,点击“分析”栏,选择“历史成交”,此时会出现股票的日线交易数据。
2.点击“右键”,选择“数据导出”—>“导出所有数据”,选择导出的类型为Excel,执行下一步直到完成,即得到了2004年至今的该股交易数据。
3.打开EXCEL文档已经可以查看到导出的数据了,不过在量化领域中最常用使用的是CSV格式,这里将EXCEL另存为CSV格式。CSV文件是一种文本文件,用记事本就能打开。文件的数据列以半角逗号分隔,每一行数据都以回车符结束。它可以非常容易地被导入各种PC表格及数据库中。将EXCEL另存为CSV格式时,CSV文件将EXCEL工作表中的单元格所显示的文本和数值以逗号分离进行保存。
注:如果单元格中包含逗号,则该单元格中的内容以双引号引起。
转换为DataFrame格式
在Python中,pandas是数据处理方面功能最为强大的扩展模块了,包含了高级的数据结构Series和DataFrame,使得在Python中处理数据变得非常方便、快速和简单,后续我们在应用中会深有体会。
方法1:通过pandas模块自带的read_csv函数可直接得到DataFrame格式数据,注意编码格式为“GB2132”,否则控制台会将中文解析为乱码。
df_csvload = pd.read_csv('C:\programPY\CSV_RWdata_ForNewFile\DataChange.csv',parse_dates=True,index_col=0,encoding='gb2312')
方法2:此处使用CSV模块的DictReader函数读取CSV文件,DictReader函数以字典形式返回,字典的键则是这个单元格的标题(即列头),每一个单元格内容放在字典的值内。DataFrame的创建方式有numpy二维数组、列表、Series序列以及字典方式等,此处DictReader函数返回的字典形式数据可直接创建,字典中的keys就是DataFrame里面的columns,但是没有index的值,默认是从零开始计数。
f=codecs.open('C:\programPY\CSV_RWdata_ForNewFile\DataChange.csv','rb','gb2312')#GB2312编码
reader = csv.DictReader(f)
rows = [row for row in reader]
df = pd.DataFrame(rows)
f.close()
该方法需要增加额外的处理,将“时间”列作为index索引,同时将日期信息去除星期几
df.rename(columns={ "时间":'time' },inplace=True)#替换为英文columns for index,colstr in enumerate(df['time']):colstr = colstr.split(',',1)#去除日期中的星期几df.loc[index, 'time'] = colstr[0]
df.index = df['time'].tolist()#time作为index
del df['time']#数据中删除time列
数据保存
数据处理后使用pandas模块自带的to_csv可将数据直接存储为CSV。
df.to_csv('C:\programPY\CSV_RWdata_ForNewFile\DataCheck.csv',columns=df.columns,index=True)
更多python量化交易内容互动请加微信公众号:PythonQT-YuanXiao
量化交易之股票数据的获取——同花顺软件 1相关推荐
- R语言使用quantmod包的getSymbols函数从指定金融数据源获取指定时间段的股票数据、获取美国10年期债券收益率数据
R语言使用quantmod包的getSymbols函数从指定金融数据源获取指定时间段的股票数据.获取美国10年期债券收益率数据 目录 R语言使用quantmod包的getSymbols函数从指定金融数 ...
- CNN模型预测股票涨跌的始末过程——(一)股票数据的获取
CNN模型预测股票涨跌的始末过程--(一)股票数据的获取[附源码和数据] 股票数据的获取 Choice数据 - 东方财富 Tushare BigQuant 最后列一下我下载成功的数据 股票数据的获取 ...
- R语言使用quantmod包的getSymbols函数从指定金融数据源获取指定时间段的股票数据、获取欧元兑美元汇率数据、每次请求只能获取500天以内的数据、多了会报错
R语言使用quantmod包的getSymbols函数从指定金融数据源获取指定时间段的股票数据.获取欧元兑美元汇率数据.每次请求只能获取500天以内的数据.多了会报错 目录 R语言使用quantmod ...
- python同花顺交易_THSTrader - 量化交易。最新版通用版同花顺客户端的python API。(Python3)...
THSTrader - 量化交易.最新版通用版同花顺客户端的python API.(Python3) 419 稳定性测试中..... https://github.com/nladuo/THSTrad ...
- 新浪财经股票数据的获取方法
2019独角兽企业重金招聘Python工程师标准>>> 股票数据的获取目前有如下两种方法可以获取:1. http/javascript接口取数据 2. web-service接口 1 ...
- 【python量化交易学习】从tushare获取股票交易数据,存入后再从mysql或excel读取数据,筛选股票,用pyecharts画出K线图。
选定日期,筛选涨幅达到10%的股票,并画出K线图.观察涨停后股票走势. 由于创业板涨停板为20%,科创板20%,北交所30%.因此筛选出的涨停股票不完全准确.考虑到目前市场打板主要集中在10%的主板股 ...
- 同花顺 sendmessage python_量化交易。最新版通用版同花顺客户端的Python3 API
THSTrader 量化交易.同花顺免费模拟炒股软件客户端的python API.(Python3) 为什么有这个项目 本来看到了这个easytrader这个项目,不过这个客户端已经过时了(被强制更新 ...
- 同花顺选股python开发_量化交易。最新版通用版同花顺客户端的Python3 API
THSTrader 量化交易.同花顺免费模拟炒股软件客户端的python API.(Python3) 为什么有这个项目 本来看到了这个easytrader这个项目,不过这个客户端已经过时了(被强制更新 ...
- 同花顺python api_量化交易。最新版通用版同花顺客户端的Python3 API
THSTrader 量化交易.同花顺免费模拟炒股软件客户端的python API.(Python3) 为什么有这个项目 本来看到了这个easytrader这个项目,不过这个客户端已经过时了(被强制更新 ...
最新文章
- 如何为机器视觉系统选择合适的图像采集卡
- python手机版idle-Python入门 | IDLE的介绍和使用方法
- 宝塔面板搭载ThinkPHP5.0项目关于open_basedir报错解决办法
- 利用Xshell实现非对称秘钥对安全登陆linux服务器(Centos、Ubuntu)
- pdf增强锐化软件_终于找到这款神器!高级锐化插件 让你的画面更清晰
- js中数组(Array)的排序(sort)注意事项
- 一次library cache pin故障的解决过程
- html班级管理模板,班级管理建议书模板参考
- maya导入abc动画_大佬养成宝典:教你四十二招玩转MAYA(三)
- 软考中级网络工程师的就业前景以及考试要求
- 一键去win7快捷方式小箭头
- L1W3 用1层隐藏层的神经网络分类二维数据
- plsql的注册激活
- Excel入门(一)
- 完蛋,公司被一条 update 语句干趴了!
- 学习英语02——词汇——01
- 佐治亚理工计算机科学录取,佐治亚理工大学计算机科学硕士申请条件及案例分享...
- Dojo 1.6 最新官方教程: Hello Dojo!
- python归一化 增大差异_Python实现描述性统计
- 【已解决】iphone和mac的备忘录、提醒事项、日历等无法同步。MacBook点击“更新Apple ID 设置”无反应。
热门文章
- 创建bean的JAVA源文件_创建 JavaBean要经过编写代码、编译源文件、配置JavaBean这样一个过程。_学小易找答案...
- 关于keil5出现“NO Browse information available in ‘***‘ “ 问题解决方法
- Ceph系列01-Ceph简介
- 采用XILINX的CORDIC IP核计算arctan2(Y,X)
- Xshell Xftp 的安装、配置及使用
- Patch-wise attack
- 华擎Deskmini 310黑苹果efi引导文件
- AndroidStudio内网编译环境搭建
- 看过和想看的电影、连续剧(不断更新)
- 【技术术语】全双工模式和半双工模式