tushare获取 保存_TuShare(2):使用TuShare,抓取股票数据并存储到数据库
TuShare(2):使用TuShare,抓取股票数据并存储到数据库
1年前200
1,关于股票数据存储
股票数据比较特殊,需要做数据统计的。都需要一次进行批量查询多个数据,然后进行分析。 所以股票数据不一定要放到数据库中存储。因为一般就两个维度。 那只股票,和那天的股票信息,然后使用模型进行分析预测。 所以数据可以存储为:/data/stock/yyyy/yyyMM/yyyyMMdd.hdf5 存储的数据是hdf5: Hierarchical DataFormat,可以存储不同类型的图像和数码数据的文件格式
2,安装hdf5库
#首先安装hdf5库yum -y install hdf5 hdf5-devel pip install
unittest2 pip install--upgrade tables
3,测试读写hdf5文件
参考pytables官方文档。
# python Python 2.6.6 (r266:84292, Jul 23
2015,15:22:56) [GCC 4.4.7 20120313 (Red Hat 4.4.7-11)] on linux2
Type"help", "copyright", "credits" or "license" for more
information.>>> import
numpy as np>>> import
pandas aspd ###su >>>
a
=np.random.standard_normal((9,4))>>>
b =pd.DataFrame(a)
>>>b.columns =
[['num1','num2','num3','num4']]>>>
aarray([[-2.36198849, -1.27547933, -1.40351822, -0.6638619 ],
[1.89159066, -0.31838519, -0.2065942 , -1.02327987],
[-2.02771503,-0.81333254, -0.93644288, -0.91592467], [-1.3939496 ,
0.25899342,1.11591841, -0.7423286 ], [-1.05104415, -0.79069151,
-1.46536873,-0.01449547], [ 1.32483444, 0.32030117, -1.23575344,
0.51455106], [0.91297435, 0.43242834, 1.77235337, 1.14879289], [
0.93476429,0.18592698, 0.30198234, -0.61861642], [ 0.04462872,
-0.99275411,-0.86382085,
-1.53064223]])>>> b
num1 num2 num3num4 0 -2.361988 -1.275479 -1.403518 -0.663862 1
1.891591 -0.318385-0.206594 -1.023280 2 -2.027715 -0.813333
-0.936443 -0.915925 3-1.393950 0.258993 1.115918 -0.742329 4
-1.051044 -0.790692-1.465369 -0.014495 5 1.324834 0.320301
-1.235753 0.514551 60.912974 0.432428 1.772353 1.148793 7 0.934764
0.185927 0.301982-0.618616 8 0.044629 -0.992754 -0.863821
-1.530642>>> b.sum()
num1-1.725905 num2 -2.992993 num3 -2.921244 num4 -3.845805
dtype:float64 >>>
b.mean()num1 -0.191767 num2 -0.332555 num3 -0.324583 num4 -0.427312
dtype:float64###写hdf5文件:>>>
h5
=pd.HDFStore('/data/stock/test1.h5','w')>>>
h5['data'] = b>>>
h5.close()>>>>>>
b num1 num2 num3num4 0 -2.361988 -1.275479 -1.403518 -0.663862 1
1.891591 -0.318385-0.206594 -1.023280 2 -2.027715 -0.813333
-0.936443 -0.915925 3-1.393950 0.258993 1.115918 -0.742329 4
-1.051044 -0.790692-1.465369 -0.014495 5 1.324834 0.320301
-1.235753 0.514551 60.912974 0.432428 1.772353 1.148793 7 0.934764
0.185927 0.301982-0.618616 8 0.044629 -0.992754 -0.863821
-1.530642###读hdf5文件。>>>
h5
=pd.HDFStore('/data/stock/test1.h5','r')>>>
c = h5['data']>>> c
num1 num2 num3num4 0 -2.361988 -1.275479 -1.403518 -0.663862 1
1.891591 -0.318385-0.206594 -1.023280 2 -2.027715 -0.813333
-0.936443 -0.915925 3-1.393950 0.258993 1.115918 -0.742329 4
-1.051044 -0.790692-1.465369 -0.014495 5 1.324834 0.320301
-1.235753 0.514551 60.912974 0.432428 1.772353 1.148793 7 0.934764
0.185927 0.301982-0.618616 8 0.044629 -0.992754 -0.863821
-1.530642>>>
h5.close()
4,TuShare读取股票数据存储
>>>import
tushare as ts>>> d
=ts.get_tick_data('600848',date='2015-01-09')>>>
type(d)
'pandas.core.frame.DataFrame'>>>>
len(d) 1212###保存数据>>>
h5
=pd.HDFStore('/data/stock/test2.h5','w')>>>
h5['data'] = d>>>
h5.close()>>>>>>###读取数据>>>
h5
=pd.HDFStore('/data/stock/test2.h5','r')>>>
e = h5['data']>>>
h5.close()>>>>>>
type(e)
'pandas.core.frame.DataFrame'>>>>
len(e) 1212
5,总结
使用文件直接存储到本地还是非常方便的。pandas直接封装的函数3行解决问题。 同时pandas封装的读出数据还是数组,可以直接进行操作。灰常方便。
tushare获取 保存_TuShare(2):使用TuShare,抓取股票数据并存储到数据库相关推荐
- Scrapy实战案例--抓取股票数据并存入SQL数据库(JS逆向)
目标网址:http://webapi.cninfo.com.cn/#/marketDataZhishu 之前在这篇文章里面对该网站的JS进行了一个逆向的解析:JS逆向解析案例 接下来我们来创建一个Sc ...
- python抓取股票数据_Python自动获取当日所有股票数据
开年以来,大盘直接从2400站上了3200,为了后续进一步分析股票数据,我想把每只股票每天的数据保存下来. import pandas as pd import tushare as ts impor ...
- python抓取股票数据_Python股票处理之一_获取国内股票数据
1. 安装支持库 $ pip install panda $ pip install tushare 2. 说明 Pandas是数据分析工具包 TuShare是国内股票数据抓取工具,除了股票的实时和历 ...
- matlab抓取股票数据,Matlab经过sina web接口获取个数即时股票数据函数实现代码
Matlab通过sina web接口获取个数即时股票数据函数实现代码 代码如下: function stockinfo = queryprice(stocktype, stockid) %stockt ...
- python如何爬虫股票数据_如何抓取股票数据_用Python抓取新浪的股票数据
python爬虫成长之路(一)抓取证券之星的股票数据 其中编译匹配模式findall方法使用这个匹配模式来匹配所需的信息并以列表的形式返回.正则表达式的语法非常多.下面我只列出使用的符号的含义.匹配除 ...
- python数据抓取技术与实战训练_师傅带徒弟学Python:项目实战1:网络爬虫与抓取股票数据...
本视频基于**Python 3.X版本 本视频课程是第四篇第一个实战项目,内容包括网络爬虫技术.使用urllib爬取数据.使用Selenium爬取数据.使用正则表达式.使用BeautifulSoup库 ...
- python抓取股票竞价数据_【整理】用Python+beautifulsoup抓取股票数据
[刚开始写总结,读者如果对我的内容有任何建议欢迎留言反馈,或直接加QQ1172617666,期待交流] 先贴上代码,再详细的写一下在写这些代码的过程中遇到的问题,解决的方法. 这些代码完成的任务是:访 ...
- 跟ArthurXF学从雅虎抓取股票数据的方法
2008/03/03 13:46 ArthurXF 本文由ArthurXF倾情奉献,转载请保留作者说明.另本人受聘上海非凡进修学院授IT技术课,招生简章在此:http://www.bizeway.n ...
- 股票数据抓取 php,如何抓取股票数据
今天把数据抽取的代码整理了下,做了个控制台程序,这个程序主要抓取了新浪网的行业数据.股票信息,股价日.周.月线的数据,并把数据存储到数据库.文章末尾提供代码下载网址,代码可运行,设置好数据库连接字符串 ...
最新文章
- 【下载】支持中文的 jspSmartUpload jar 包
- 在哪里能收到python实例代码-python实现网站微信登录的示例代码
- 《学习opencv》笔记——矩阵和图像处理——cvGEMM,cvGetCol,cvGetCols and cvGetDiag
- jquery 字符串查找_Python Appium 库IOS特有元素查找API介绍
- C++中拷贝构造函数
- MyBatis复习(二):mybatis-config.xml核心配置文件
- bootstrap tab切换无效的一种情况
- django多条件筛选搜索(项目实例)
- 问题-Ctrl+F7跟踪值时提示“Function to be called, TGGLPolyhedron3d.AsString, was eliminated by linker”...
- gb28181简单实现sip信令服务器(java版基于springboot):二、sip摄像头注册(信令解读)
- 计算机专业的学生可以考哪些证书
- Win11dns解析状态异常怎么处理?Win11dns解析失败解决方法
- C - Quick Sort (one of the simplest)
- DNS记录类型介绍(A记录、MX记录、NS记录等)
- stm32结合TFLCD编程遇到的问题之.\Objects\EXTI_Project.axf: Error: L6218E: Undefined symbol POINT_COLOR (referre
- SafetyNet简要梳理
- [加载XlUE组件失败,迅雷看看桌面图标已损坏,请重新安装。]问题处理
- 天津插画师培训机构 ,0基础可以学吗?
- 到底还要学什么才能成为2020年前端架构师!?(用图说话)
- 苹果cms怎么同步图片到新浪或是七牛云存储
热门文章
- R语言当前目录获取及设置函数(getwd setwd)实战
- python代码实现二叉树的镜像树
- 编译+构建+链接+运行之间的关系分析
- java drools5_Java Drools5.1 规则流基础【示例】
- java interface class_Java中常量定义在interface和class的区别(转)
- 中国科学家研发新的全基因组组装算法
- Python pandas用法
- C#程序结构 基本语法
- 序列多重比对工具:MUSCLE
- 用计算机弹奏lemon乐谱,原神乐谱lemon怎么弹 lemon乐谱弹奏方法教学