TuShare(2):使用TuShare,抓取股票数据并存储到数据库

1年前200

1,关于股票数据存储

股票数据比较特殊,需要做数据统计的。都需要一次进行批量查询多个数据,然后进行分析。 所以股票数据不一定要放到数据库中存储。因为一般就两个维度。 那只股票,和那天的股票信息,然后使用模型进行分析预测。 所以数据可以存储为:/data/stock/yyyy/yyyMM/yyyyMMdd.hdf5 存储的数据是hdf5: Hierarchical DataFormat,可以存储不同类型的图像和数码数据的文件格式

2,安装hdf5库

#首先安装hdf5库yum -y install hdf5 hdf5-devel pip install

unittest2 pip install--upgrade tables

3,测试读写hdf5文件

参考pytables官方文档。

# python Python 2.6.6 (r266:84292, Jul 23

2015,15:22:56) [GCC 4.4.7 20120313 (Red Hat 4.4.7-11)] on linux2

Type"help", "copyright", "credits" or "license" for more

information.>>> import

numpy as np>>> import

pandas aspd ###su >>>

a

=np.random.standard_normal((9,4))>>>

b =pd.DataFrame(a)

>>>b.columns =

[['num1','num2','num3','num4']]>>>

aarray([[-2.36198849, -1.27547933, -1.40351822, -0.6638619 ],

[1.89159066, -0.31838519, -0.2065942 , -1.02327987],

[-2.02771503,-0.81333254, -0.93644288, -0.91592467], [-1.3939496 ,

0.25899342,1.11591841, -0.7423286 ], [-1.05104415, -0.79069151,

-1.46536873,-0.01449547], [ 1.32483444, 0.32030117, -1.23575344,

0.51455106], [0.91297435, 0.43242834, 1.77235337, 1.14879289], [

0.93476429,0.18592698, 0.30198234, -0.61861642], [ 0.04462872,

-0.99275411,-0.86382085,

-1.53064223]])>>> b

num1 num2 num3num4 0 -2.361988 -1.275479 -1.403518 -0.663862 1

1.891591 -0.318385-0.206594 -1.023280 2 -2.027715 -0.813333

-0.936443 -0.915925 3-1.393950 0.258993 1.115918 -0.742329 4

-1.051044 -0.790692-1.465369 -0.014495 5 1.324834 0.320301

-1.235753 0.514551 60.912974 0.432428 1.772353 1.148793 7 0.934764

0.185927 0.301982-0.618616 8 0.044629 -0.992754 -0.863821

-1.530642>>> b.sum()

num1-1.725905 num2 -2.992993 num3 -2.921244 num4 -3.845805

dtype:float64 >>>

b.mean()num1 -0.191767 num2 -0.332555 num3 -0.324583 num4 -0.427312

dtype:float64###写hdf5文件:>>>

h5

=pd.HDFStore('/data/stock/test1.h5','w')>>>

h5['data'] = b>>>

h5.close()>>>>>>

b num1 num2 num3num4 0 -2.361988 -1.275479 -1.403518 -0.663862 1

1.891591 -0.318385-0.206594 -1.023280 2 -2.027715 -0.813333

-0.936443 -0.915925 3-1.393950 0.258993 1.115918 -0.742329 4

-1.051044 -0.790692-1.465369 -0.014495 5 1.324834 0.320301

-1.235753 0.514551 60.912974 0.432428 1.772353 1.148793 7 0.934764

0.185927 0.301982-0.618616 8 0.044629 -0.992754 -0.863821

-1.530642###读hdf5文件。>>>

h5

=pd.HDFStore('/data/stock/test1.h5','r')>>>

c = h5['data']>>> c

num1 num2 num3num4 0 -2.361988 -1.275479 -1.403518 -0.663862 1

1.891591 -0.318385-0.206594 -1.023280 2 -2.027715 -0.813333

-0.936443 -0.915925 3-1.393950 0.258993 1.115918 -0.742329 4

-1.051044 -0.790692-1.465369 -0.014495 5 1.324834 0.320301

-1.235753 0.514551 60.912974 0.432428 1.772353 1.148793 7 0.934764

0.185927 0.301982-0.618616 8 0.044629 -0.992754 -0.863821

-1.530642>>>

h5.close()

4,TuShare读取股票数据存储

>>>import

tushare as ts>>> d

=ts.get_tick_data('600848',date='2015-01-09')>>>

type(d)

'pandas.core.frame.DataFrame'>>>>

len(d) 1212###保存数据>>>

h5

=pd.HDFStore('/data/stock/test2.h5','w')>>>

h5['data'] = d>>>

h5.close()>>>>>>###读取数据>>>

h5

=pd.HDFStore('/data/stock/test2.h5','r')>>>

e = h5['data']>>>

h5.close()>>>>>>

type(e)

'pandas.core.frame.DataFrame'>>>>

len(e) 1212

5,总结

使用文件直接存储到本地还是非常方便的。pandas直接封装的函数3行解决问题。 同时pandas封装的读出数据还是数组,可以直接进行操作。灰常方便。

tushare获取 保存_TuShare(2):使用TuShare,抓取股票数据并存储到数据库相关推荐

  1. Scrapy实战案例--抓取股票数据并存入SQL数据库(JS逆向)

    目标网址:http://webapi.cninfo.com.cn/#/marketDataZhishu 之前在这篇文章里面对该网站的JS进行了一个逆向的解析:JS逆向解析案例 接下来我们来创建一个Sc ...

  2. python抓取股票数据_Python自动获取当日所有股票数据

    开年以来,大盘直接从2400站上了3200,为了后续进一步分析股票数据,我想把每只股票每天的数据保存下来. import pandas as pd import tushare as ts impor ...

  3. python抓取股票数据_Python股票处理之一_获取国内股票数据

    1. 安装支持库 $ pip install panda $ pip install tushare 2. 说明 Pandas是数据分析工具包 TuShare是国内股票数据抓取工具,除了股票的实时和历 ...

  4. matlab抓取股票数据,Matlab经过sina web接口获取个数即时股票数据函数实现代码

    Matlab通过sina web接口获取个数即时股票数据函数实现代码 代码如下: function stockinfo = queryprice(stocktype, stockid) %stockt ...

  5. python如何爬虫股票数据_如何抓取股票数据_用Python抓取新浪的股票数据

    python爬虫成长之路(一)抓取证券之星的股票数据 其中编译匹配模式findall方法使用这个匹配模式来匹配所需的信息并以列表的形式返回.正则表达式的语法非常多.下面我只列出使用的符号的含义.匹配除 ...

  6. python数据抓取技术与实战训练_师傅带徒弟学Python:项目实战1:网络爬虫与抓取股票数据...

    本视频基于**Python 3.X版本 本视频课程是第四篇第一个实战项目,内容包括网络爬虫技术.使用urllib爬取数据.使用Selenium爬取数据.使用正则表达式.使用BeautifulSoup库 ...

  7. python抓取股票竞价数据_【整理】用Python+beautifulsoup抓取股票数据

    [刚开始写总结,读者如果对我的内容有任何建议欢迎留言反馈,或直接加QQ1172617666,期待交流] 先贴上代码,再详细的写一下在写这些代码的过程中遇到的问题,解决的方法. 这些代码完成的任务是:访 ...

  8. 跟ArthurXF学从雅虎抓取股票数据的方法

    2008/03/03 13:46  ArthurXF 本文由ArthurXF倾情奉献,转载请保留作者说明.另本人受聘上海非凡进修学院授IT技术课,招生简章在此:http://www.bizeway.n ...

  9. 股票数据抓取 php,如何抓取股票数据

    今天把数据抽取的代码整理了下,做了个控制台程序,这个程序主要抓取了新浪网的行业数据.股票信息,股价日.周.月线的数据,并把数据存储到数据库.文章末尾提供代码下载网址,代码可运行,设置好数据库连接字符串 ...

最新文章

  1. 【下载】支持中文的 jspSmartUpload jar 包
  2. 在哪里能收到python实例代码-python实现网站微信登录的示例代码
  3. 《学习opencv》笔记——矩阵和图像处理——cvGEMM,cvGetCol,cvGetCols and cvGetDiag
  4. jquery 字符串查找_Python Appium 库IOS特有元素查找API介绍
  5. C++中拷贝构造函数
  6. MyBatis复习(二):mybatis-config.xml核心配置文件
  7. bootstrap tab切换无效的一种情况
  8. django多条件筛选搜索(项目实例)
  9. 问题-Ctrl+F7跟踪值时提示“Function to be called, TGGLPolyhedron3d.AsString, was eliminated by linker”...
  10. gb28181简单实现sip信令服务器(java版基于springboot):二、sip摄像头注册(信令解读)
  11. 计算机专业的学生可以考哪些证书
  12. Win11dns解析状态异常怎么处理?Win11dns解析失败解决方法
  13. C - Quick Sort (one of the simplest)
  14. DNS记录类型介绍(A记录、MX记录、NS记录等)
  15. stm32结合TFLCD编程遇到的问题之.\Objects\EXTI_Project.axf: Error: L6218E: Undefined symbol POINT_COLOR (referre
  16. SafetyNet简要梳理
  17. [加载XlUE组件失败,迅雷看看桌面图标已损坏,请重新安装。]问题处理
  18. 天津插画师培训机构 ,0基础可以学吗?
  19. 到底还要学什么才能成为2020年前端架构师!?(用图说话)
  20. 苹果cms怎么同步图片到新浪或是七牛云存储

热门文章

  1. R语言当前目录获取及设置函数(getwd setwd)实战
  2. python代码实现二叉树的镜像树
  3. 编译+构建+链接+运行之间的关系分析
  4. java drools5_Java Drools5.1 规则流基础【示例】
  5. java interface class_Java中常量定义在interface和class的区别(转)
  6. 中国科学家研发新的全基因组组装算法
  7. Python pandas用法
  8. C#程序结构 基本语法
  9. 序列多重比对工具:MUSCLE
  10. 用计算机弹奏lemon乐谱,原神乐谱lemon怎么弹 lemon乐谱弹奏方法教学