基于tushare数据对沪深300成分股进行聚类分析,参考https://scikit-learn.org/stable/auto_examples/applications/plot_stock_market.html

在处理过程中遇到的问题记录一下:

1.不同函数获得数据索引的datetime格式不同

import tushare as ts
HS300=ts.get_h_data(code='000300',start='2018-01-01',end='2019-05-28',index=True)
PFbank=ts.get_hist_data(code='600000',start='2018-01-01',end='2019-5-27')

type(HS300.index)和type(PFbank.index)的结果是不一样的,所以如果直接pd.concat会报错。

建议使用pd.to_datetime()将两个索引变为同样的格式。

2.个股交易信息在停牌日是略过的,有的个股会有非交易日的错误信息

某只股票在2019年5月30日停牌,用ts.get_hist_data就不会有5月30日的索引。所以在相同时间区间内,返回的数据的长度是不一致的,这个要注意。对沪深300成分股下载同一年度的数据,就会出现有的股票少了几十行的数据,不利于后面数据处理。

tushare提供的API不能对缺失的交易日信息进行自动填充,这就需要我们自己动手。我的方法比较土,第一步用沪深300的指数交易日为基准,补齐个股的索引datetime,然后删除个股的非交易日信息;第二步,将填充后会出现的NaN空值,先用前一交易日数据填充,再用后一交易日数据填充,这样确保这个时间区间里,所有空值都有数据填充。


#沪深300指数信息简化,保留一个最简单的临时列。
HS300['temporary']=1
tradeday=HS300['temporary']#删除与指数不一致的datetime索引
for each in PFbank.index:if each not in tradeday.index:PFbank=PFbank.drop(index=each)
#合并两个dataframePFbank=pd.concat([tradeday,PFbank],axis=1)
#先用前一交易日数据对后面的NaN数据填充,再用后一交易日对前面的NaN数据填充PFbank=PFbank.fillna(method='ffill')PFbank=PFbank.fillna(method='bfill')
#检验填充后是否存在空值
print(PFbank.isnull.sum())

tushare股票数据分析中遇到的问题相关推荐

  1. 利用tushare进行股票数据分析

    笔者tushare ID:476408 在经过了半年时间的学习中,对熟练的使用tushare进行股票数据分析方面具有一定的基础,能够基本掌握一些常用的算法编程,以下就以自己在校期间的分析报告为分享内容 ...

  2. Tushare之股票数据分析

    笔者ID:476408 已经使用了整整1年时间的Tushare,个人来讲,在使用过程中体验还是相当不错的.在获取数方面较全面,涵盖数据内容多,而且还不断完善丰富. 下面是利用Tushare 进行股票数 ...

  3. 从贵州茅台上市的第一天起,每天买一手茅台能够盈利多少?-利用python进行茅台股票数据分析

    从贵州茅台上市的第一天起,每天买一手茅台能够盈利多少?-利用python进行茅台股票数据分析(未统计分红和配股数据) 1.使用tushare获取2000至今的股票数据 1)首先, 使用前我们在tush ...

  4. 分析mysql股票数据_股票数据分析(一)数据获取

    前段时间开始做股票数据分析的业余项目,希望能提高自己对大型数据量的处理能力.目前大致的想法是用python的tushare模块获取数据,用Java的框架做发布. 1.Tushare模块的说明 tush ...

  5. html5绘制股票图形,股票数据分析(五):绘制股票k线图(js+canvas + Python + json)

    本文介绍:利用 js+canvas 绘制股票k线图 HTML5 标签用于绘制图像(通过脚本,通常是 JavaScript). 不过, 元素本身并没有绘制能力(它仅仅是图形的容器) - 您必须使用脚本来 ...

  6. 基于Python实现成交量的股票数据分析系统【100010993】

    基于成交量的股票数据分析系统 1. 数据获取 1.1. 实验环境搭建 系统及使用的语言: Windows 10 专业版 1903 操作系统版本: 18362.356 Python 3.7.3 64-b ...

  7. Python实现股票数据分析的可视化

    Python实现股票数据分析的可视化 文章目录 Python实现股票数据分析的可视化 一.简介 二.代码 1.主文件 2.数据库使用文件 3.ui设计模块 4.数据处理模块 三.数据样例的展示 四.效 ...

  8. python在大数据分析中的应用

    每个人都喜欢Python,如果您打算开始从事数据科学事业,我们可以肯定Python在您心中已经占有特殊的位置.它直观且易于在任何平台上运行,并且具有大量令人惊叹的库和工具.与其他编程语言相比,Pyth ...

  9. Python项目实战:数据可视化与股票数据分析-关东升-专题视频课程

    Python项目实战:数据可视化与股票数据分析-333人已学习 课程介绍         本视频内容包括使用Matplotlib绘制图表.MySQL数据库.Python访问数据库和Lambda表达式. ...

最新文章

  1. RGB CMYK HSV LAB
  2. 2018-2019 20165227《信息安全系统设计基础》第三周学习总结
  3. call线程起名字_Java线程的5个使用技巧
  4. easy js test--方便对js进行测试,不需要刷新
  5. [vue]vue渲染模板时怎么保留模板中的HTML注释呢?
  6. 智能制造的灾备问题如何解决?
  7. 001.常见监控简介
  8. 大数据_Flink_数据处理_yarn和k8s平台的flink部署---Flink工作笔记0015
  9. 查linux服务器CPU多少C,在linux 下怎么查看服务器的cpu和内存的硬件信息
  10. 如何写一个简单的Web Service
  11. 微信小程序图片上传组件
  12. 刷访问量新招[流量精灵]
  13. 使用Flash骨骼工具制作角色动画
  14. 远程桌面由于以下原因无法连接远程计算机,win10远程桌面提示由于以下原因之一无法连接的解决教程...
  15. FST构图可视化详解
  16. 京东店铺如何批量修改主推SKU?
  17. 惠普笔记本重装系统后没有声音如何解决
  18. EOS智能合约开发系列(十): 抵御彩虹攻击
  19. web期末作业设计网页:动漫网站设计——蜡笔小新(10页) HTML+CSS+JavaScript 学生DW网页设计作业成品 动漫网页设计作业 web网页设计与开发 html实训大作业...
  20. 新建几个普通用户wukong,wuneng,wujing,他们都属于xiyouji组的成员,其中wujing没有和系统交互的shell~

热门文章

  1. python如何实现隔行_Python编写循环的两个建议 | 鹅厂实战
  2. Spring请求与响应——响应
  3. Lenovo Thinkpad T14电脑 Hackintosh 黑苹果efi引导文件
  4. Numpy学习——科学计算
  5. 如何构建一套有效的量化系统
  6. 硬件电路工程师最全入门工作指南!
  7. Java基础书籍推荐
  8. 大淘客php调用外部js,怎么请求大淘客API
  9. hdu 5708 Alice and Bob(尼姆博弈)
  10. 三菱mode bus tcp通讯_24个PLC编程入门级案例分享,三菱篇!