股价的预测

这个领域属于量化投资,也就是通过数量化的方式和模型去做投资决策。量化投资是一个很庞大的领域,从量化投资开始至今,衍生出了大量的投资理念和策略。

纵观国内外量化投资现状,国内其实刚刚起步,还有很长的路要走,这里包括数据的完整性、透明性等。 国内目前散户(个人投资者)很多,但比如像美国这些欧美国家,绝大部分是以机构投资者为主的,而且他们很多都在使用量化投资技术。

此项目关注的地方:

1、大概了解如何使用AI做量化投资
2、什么叫特征工程,如何做?
3、时序数据如何处理?

需要完成的任务是:给定历史股市行情数据,预测未来涨或者跌。比如给定过去10天的股市行情,预测某一只股票明天涨或者跌。

K线图

MA5 过去5天的平均值Moving Average

MA10 每10天平均

MA20 每20天平均

MA60 每60天平均

DMI, OVI, OCC等指标

分时线:

对于国内的A股,它是T+1市场,也就是我们当天买的股票,只能第二天再卖出去,不像美股一样我们可以针对某一只股票做无限次买卖操作。所以国内的A股市场,目前是玩不了高频交易的。所谓的高频交易就是指比如每秒都可以买卖。

那A股的历史股票数据从哪里可以获得呢?如果自己开公司炒股,那最好通过第三方正规渠道直接买入交易所的数据,这是最精准的。但如果只是学习目的,就想玩一玩的话,可以使用网络上的一些开源数据。

Tushare接口

任务:

基于过去N天的股市行情数据来预测某只股票未来M天后的涨跌。所以这个问题本身是二分类问题,其实就是预测某一只股票涨或者跌!

虽然数据本身是时序数据,但我们完全可以把时序问题转换成经典的二分类问题。

特征工程技术:如何从给定的股票行情数据构建训练样本,以及股票特征工程技术。

如果基于过去的行情数据来构建样本?

从时序图抽取指标,比如MA5

基于上述行情数据我们能够抽取什么样的特征呢?

这里的学问就大了! 从量化投资诞生以来,很多人试图寻找有效的"信号“, 这个信号可以简单理解成特征就可以了。

比如取一下过去5天的平均收盘价作为一个信号,或者过去5天最高价作为信号等等。

股票计算指标计算公式:http://www.yingjia360.com/gongshi/

针对于每一只股票,我们可以基于它过去一段时间的行情数据来计算各式各样的指标,然后把指标结果作为特征值来对待就可以了,接着通过特征值预测未来会不会涨或者跌。而且我们可以提前构建好需要预测的标签。

接下来,就可以通过分类算法来预测,并比较跟真实标签之间的差异,这个也叫做准确率。

一定要关注特征工程,而且特征工程是来自于对问题和数据的理解。模型都是封装好的,但对问题和数据的理解是无法封装的

以下项目的指标采用准确率,也就是来看算法对于判断未来涨或者跌到底有多准确(实际量化投资采用收益率来作为指标,但涉及较多的金融知识,所以简化)

基于集成学习模型的估价预测(量化投资)相关推荐

  1. 集成学习模型(xgboost、lightgbm、catboost)进行回归预测构建实战:异常数据处理、缺失值处理、数据重采样resample、独热编码、预测特征检查、特征可视化、预测结构可视化、模型

    集成学习模型(xgboost.lightgbm.catboost)进行回归预测构建实战:异常数据处理.缺失值处理.数据重采样resample.独热编码.预测特征检查.特征可视化.预测结构可视化.模型保 ...

  2. 机器学习中的集成学习模型实战完整讲解

    2019-12-03 13:50:23 集成学习模型实践讲解 --沂水寒城 无论是在机器学习领域还是深度学习领域里面,通过模型的集成来提升整体模型的性能是一件非常有效的事情,当前我们所接触到的比较成熟 ...

  3. 谷歌发布AdaNet,快速灵活的AutoML工具,帮助开发者构筑强大集成学习模型

    点击我爱计算机视觉标星,更快获取CVML新技术 集成学习可以有效利用不同机器学习算法,提高最终模型精确度,在Kaggle比赛中被广泛应用. 训练集成学习模型计算量浩大,参数众多,虽然随着GPU/TPU ...

  4. 基于集成学习的小麦赤霉病高光谱图像识别方法研究

    基于集成学习的小麦赤霉病高光谱图像识别方法研究 1.研究思路 [1]深度学习方法,通过构建深度神经网络模型对小麦赤霉病进行识别.构建四个不同结构的深度神经网络模型,并对这四个模型进行结构分析. [2] ...

  5. 基于深度学习的建筑能耗预测04——能耗建模

    天津城建大学建筑学院18级-数字设计-基于深度学习的建筑能耗预测-2021WS 作者:徐仔 指导老师:万老师.丁老师 带组导师:宋学姐(建筑学专业).卢学长(计算机专业) (转载请注明出处)  基于G ...

  6. 机器学习系列笔记十三: 集成学习/模型聚合

    机器学习系列笔记十三: 集成学习/模型聚合 文章目录 机器学习系列笔记十三: 集成学习/模型聚合 什么是集成学习 Voting Hard Voting 模拟实现Hard Voting 集成学习 使用V ...

  7. 基于深度学习的驾驶行为预测方法

    基于深度学习的驾驶行为预测方法 1 概述 2 深度学习算法 3 驾驶行为预测建模 4 结论 5 参考文献 6 python LSTM程序 7 python LSTM模型调用 1 概述 在汽车前向仿真中 ...

  8. i6mA-DNC:基于深度学习的二核苷酸表示预测水稻基因组DNA n6 -甲基腺苷位点

    i6mA-DNC:基于深度学习的二核苷酸表示预测水稻基因组DNA n6 -甲基腺苷位点 摘要 一.简介 二.材料和方法 1.基准数据集 2.提出的模型 3.绩效评估 3.1交叉验证 三.结果与讨论 四 ...

  9. A Deep Learning-Based Remaining Useful Life Prediction Approach for Bearings 基于深度学习的轴承剩余寿命预测

    A Deep Learning-Based Remaining Useful Life Prediction Approach for Bearings 基于深度学习的轴承剩余寿命预测 目录 A De ...

  10. 基于集成学习的不平衡数据集分类问题研究--文献阅读

    参考文献 基于集成学习的不平衡数据集分类问题研究 - 中国知网https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CMFD&dbname=C ...

最新文章

  1. MPB:扬州大学王梦芝组-​​反刍动物瘤胃原虫的分离培养与形态学分析
  2. android客户端访问服务端,服务端返回json数据
  3. PHP之Smarty简单实现
  4. 在Java中怎么判断传递过来的字符串是否是数字,或者是否是字符串?(亲测)
  5. 【Linux】一步一步学Linux——Centos7.5安装图解(08)
  6. python字符串转浮点数_如何在Python中检查字符串是否为数字(浮点数)?
  7. SyntaxError:identifier starts immediately after numeric literal
  8. python vlookup 模糊_如何用python写excel中的vlookup函数?
  9. PSCC2018 安装教程
  10. PostgreSQL客户端无法访问数据库问题
  11. winform c# chart控件添加边界值线条以及扩展性功能
  12. LLDP协议编写要点
  13. 鸿蒙系统的特点,鸿蒙系统有什么特别之处
  14. 微信小程序input标签详解
  15. 项目管理的七个工作法则
  16. UCOSIII总结------消息队列(6)
  17. 高效缓冲区输入输出流
  18. 手把手教你快速入门知识图谱 - Neo4J教程
  19. Bluetooth Baseband介绍
  20. 成功编译和运行roslaunch qbo_webi qbo_webi.launch(解决qbo_object_recognition之后的其他问题)

热门文章

  1. 常用通信协议——IIC详解(全网最全)
  2. JSP校园自行车租赁网站平台管理系统
  3. 《你的灯亮着吗》第一遍读后感
  4. WIN10命令提示符/黑窗口/cmd打不开怎么办
  5. 使用梦网云通讯平台解决手机验证码问题
  6. easydarwin 安装_win10安装EasyDarwin并作为流媒体服务器的推流和拉流实例
  7. 单片机 防破解 技术论述
  8. 绿联网卡转接mac设置_绿联外置网卡Mac os 11.0 Big Sur驱动方案来了
  9. Windows11系统引导修复(因EasyBCD误删win11启动)
  10. Vc++安装包_Visual C++ 6.0中文版安装包下载及安装教程