1. 上证50成分股

上证50指数依据样本稳定性和动态跟踪相结合的原则,每半年调整一次成份股,调整时间与上证180指数一致。特殊情况时也可能对样本进行临时调整。
每次调整的比例一般情况不超过10%。样本调整设置缓冲区,排名在40名之前的新样本优先进入,排名在60名之前的老样本优先保留。查看详情,请点击这里

2016-02-25发布

浦发银行 (600000)   包钢股份 (600010)   华夏银行 (600015)
民生银行 (600016)   上港集团 (600018)   中国石化 (600028)
中信证券 (600030)   招商银行 (600036)   保利地产 (600048)
中国联通 (600050)   上汽集团 (600104)   国金证券 (600109)
北方稀土 (600111)   中国船舶 (600150)   康美药业 (600518)
贵州茅台 (600519)   海螺水泥 (600585)   东方明珠 (600637)
国电电力 (600795)   海通证券 (600837)   伊利股份 (600887)
中航动力 (600893)   东方证券 (600958)   招商证券 (600999)
大秦铁路 (601006)   中国神华 (601088)   兴业银行 (601166)
北京银行 (601169)   中国铁建 (601186)   国泰君安 (601211)
农业银行 (601288)   中国平安 (601318)   交通银行 (601328)
新华保险 (601336)   中国中铁 (601390)   工商银行 (601398)
中国太保 (601601)   中国人寿 (601628)   中国建筑 (601668)
中国电建 (601669)   华泰证券 (601688)   中国中车 (601766)
中国交建 (601800)   光大银行 (601818)   中国石油 (601857)
方正证券 (601901)   中国核电 (601985)   中国银行 (601988)
中国重工 (601989)   中信银行 (601998)   

对以上数据处理后保存到一个SH50.list文件中,参见源代码。

600000.SS 浦发银行
600010.SS 包钢股份
600015.SS 华夏银行
600016.SS 民生银行
600018.SS 上港集团
600028.SS 中国石化
600030.SS 中信证券
600036.SS 招商银行
600048.SS 保利地产
600050.SS 中国联通

2. 读取文件

def read_stocks(stock_file):print 'read_stocks...'ls_stock_name = []f = open(stock_file, 'r')for line in f.readlines():if line.strip():ls_stock_name.append(line.strip().split(' ')[0])f.close()return ls_stock_name

3. 从Yahoo获取股票数据

Python获取Yahoo股票数据

def get_yahoo_data(stock):start = time.time()res = True_now = datetime.datetime.now()try:if stock[0] == '$':stock = '^' + stock[1:]print 'get %s ...' % stockf = open(data_path + '/' + stock + ".csv", 'w')params = urllib.urlencode({'a': 1, 'b': 1, 'c': 2004, 'd': _now.day, 'e': _now.month, 'f': _now.year, 's': stock})url = "http://ichart.finance.yahoo.com/table.csv?%s" % paramstime.sleep(0.5)url_get = urllib2.urlopen(url)data = url_get.readline()while(len(data) > 0):# print dataf.write(data)data = url_get.readline()f.close()print "Fetch [%s] done, cost : %s." % (stock,  (time.time() - start))except urllib2.HTTPError:res = Falsemiss_stock.append(stock)print "Unable to fetch data for stock: {0} at {1}".format(stock, url)except urllib2.URLError:res = Falsemiss_stock.append(stock)print "URL Error for stock: {0} at {1}".format(stock, url)except SocketError as e:res = Falsemiss_stock.append(stock)print "Socket Error for stock: {0} at {1}".format(stock, url)except :res = Falsemiss_stock.append(stock)print "Unknown Error for stock: {0} at {1}".format(stock, url)return res

4. 多线程模块

def get_yahoo_datas(ls_stock_name):print 'get_yahoo_data...'if len(ls_stock_name) <= 0:returnprint data_pathprint ls_stock_nameif not (os.access(data_path, os.F_OK)):os.makedirs(data_path)#     pool = mythreadpool.ThreadPool(8)
#     for stock in ls_stock_name:
#         pool.add_job(get_yahoo_data, stock)
#     pool.wait()pool = threadpool.ThreadPool(10)reqs = threadpool.makeRequests(get_yahoo_data, ls_stock_name)[pool.putRequest(req) for req in reqs]pool.wait()print "All done. Got {0} stocks. Could not get {1}".format(len(ls_stock_name) - len(miss_stock), len(miss_stock))return

5. 源代码

http://download.csdn.net/detail/xiyanlgu/9443331

6. 参考文献

[1] 上证50指数成分股列表 http://www.sse.com.cn/market/sseindex/indexlist/s/i000016/const_list.shtml

Python多线程获取上证50成分股交易数据相关推荐

  1. Python 与金融科技5|批量抓取并保存上证50的交易数据

    本期我们将利用上一期爬取到的上证50的五十只股票代码,学习如何使用API接口从雅虎批量获取交易数据,并将每支股票的交易数据以CSV的格式保存到本地.另外本期还会涉及到一些常用的文件操作. 前言 在这个 ...

  2. 上证50成分股聚类分析

       使用tushare我们可以获取上证50成分股历史数据,使用covariance对其历史数据进行聚类分析,我们可以得到其相关强度,对此,在其相关股价显著变化的时候,我们就可以根据其相关 ...

  3. python画资本市场线_【投资组合理论】Python绘制上证50成分股有效前沿和CML

    马科维茨有效前沿是经典的资产配置模型,对于给定收益率,有效前沿上的投资组合风险最小. 初学时,感觉绘制有效前沿是个极其有难度的事情,基本不可能完成.后来学了Python的一些数值计算方法,才感觉用程序 ...

  4. 上证50成分股聚类可视化

    上证50成分股聚类可视化 参考:sklearn中的股票可视化例子 Visualizing the stock market structure 数据来源:tushare 到网站 https://tus ...

  5. SkLearn 对上证50成分股聚类

    1. 为什么要对股票进行聚类 1.1 投资组合优化理论 股票聚类的基本原因就是从股市中选取一部股票进行投资.哪怕是上证50对一般的投资模型来说50条股票也太多了. 按照投资组合优化理论选取标准为: ( ...

  6. 使用python多线程获取代理IP(代理IP池,附源码)

    @[TOC]使用python多线程获取代理IP(代理IP池,附源码) 代理IP池 都说现在是大数据的时代,大多数的厂商会特别的注重自己家的数据安全问题,但同时,也有着许多的行业是需要大数据来做支撑的, ...

  7. python获取交易软件数据_几行Python代码,轻松获取美股阿里巴巴的交易数据

    原创: 野马 菜鸟学Python 学Python可以干很多事情,比如爬虫,数据分析,机器学习,但是有一个非常小众的分支,不仅结合了两大高薪行业,而且还薪水非常诱人,就是量化金融岗位.目前Python已 ...

  8. 几行Python代码,轻松获取美股阿里巴巴的交易数据

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 野马 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自 ...

  9. 初入python,尝试获得A股交易数据(3)——利用tushare获取A股大单交易数据

    获取大单交易数据 获取大单交易数据,默认为大于等于400手,数据来源于新浪财经. 参数说明: code:股票代码,即6位数字代码 date:日期,格式YYYY-MM-DD vol:手数,默认为400手 ...

  10. 什么品种的猫最受欢迎?Python爬取猫咪网站交易数据

    本篇文章是关于某化妆品企业的销售分析.从分析思路开始带大家一步步地用python进行分析,找出问题,并提出解决方案的整个流程. 以下文章来源于修炼Python 作者:叶庭云 Python爬虫.数据分析 ...

最新文章

  1. 当 Redis 发生高延迟时,到底发生了什么
  2. 算力网络 — 东数西算与算力网络
  3. Java常量字符串String理解
  4. DeepMind将博弈论融入多智能体研究,让纳什均衡变得更简单
  5. .bat文件该图标_电脑桌面图标变成白色方块图标怎么办?
  6. POJ - 2018 Best Cow Fences(二分+最长连续子段和)
  7. hadoop常用命令总结
  8. 前端学习(2954):vue文件的三大组成部分
  9. VUE:兄弟组件间传参
  10. 基于Eureka的服务治理
  11. SQL导入/导出Excel
  12. 在sqlserver sql语句中查找速度快
  13. latex table 表格 显示每行横线
  14. 勤哲excel服务器端口协议,勤哲Excel服务器技术支持|Excel服务器常见问题解答
  15. 搭建Hive远程模式初始化的时候报错Access denied for user ‘root‘@‘node1‘(using password:YES)
  16. 惠普MFP774dn扫描功能
  17. pip国内镜像(清华大学镜像)
  18. html高德地图无法显示,关于高德地图不显示的问题
  19. html导出excel
  20. 最好的在线PDF转换工具服务

热门文章

  1. 机器学习实战——3.4 示例:使用决策树预测隐形眼镜类型
  2. 华为2019校招实习笔试-软件题
  3. Python实现Eternal Night游戏(尚未完结,不断更新)
  4. 好听又好看!歌曲视频制作,手把手教你制作音乐视频
  5. 深入浅出的讲解傅里叶变换(真正的通俗易懂)
  6. 声网合伙人王骅:聊聊企业拥抱全球化 关键是什么?
  7. Andersen Global宣布进驻印度市场
  8. 青少儿编程Python入门教程——Python基础知识库
  9. poj2387(Dijkstra)
  10. 经度,纬度的正则表达式