数量技术宅团队在CSDN学院推出了量化投资系列课程

欢迎有兴趣系统学习量化投资的同学,点击下方链接报名:

量化投资速成营(入门课程)

Python股票量化投资

Python期货量化投资

Python数字货币量化投资

C++语言CTP期货交易系统开发

数字货币JavaScript语言量化交易系统开发


更多精彩内容,欢迎关注公众号:数量技术宅,也可添加技术宅个人微信号:sljsz01,与我交流。

引言

不论在学术领域还是实践范畴上,股价预测一直是重要的研究课题。直到现在,各种预测股价的理论仍然在不断研究中。在金融领域,用来解释股票价格界面分析的特性被称为“因子”,很多金融方面的研究已经识别出了这些截面数据因子跟股价涨跌的关系。由于这些因子和股票价格的关系日趋复杂和非线性,最近,使用机器学习,特别是深度学习用于预测股票价格的研究被不断提出。不过,这些理论上的研究都和实际的投资操作有着一定距离。

我们解读的这篇论文《Cross-sectional Stock Price Prediction using Deep Learning for Actual Investment Management》被2020年国际人工智能与区块链大会(AIBC 2020)收录,在文章中,作者提出了使用深度学习进行实际投资管理的截面每日股价预测框架。 例如,作者使用在收盘时可用的信息来构建投资组合,并在第二天开盘时进行投资。作者在日本股票市场进行实证分析,并确认框架的盈利能力。

前置概念介绍

股价预测已经日渐成为一个重要的研究主题,各类预测股价的理论不断提出,到目前为止,这些理论大概可以分位两个方面:时间序列分析和截面数据分析。

第一类理论将股票价格作为时间序列数据,然后进行时间序列分析。金融上的时间序列分析始于线性模型,例如自回归模型(AR),这类模型中,参数是唯一且确定的。在实际的金融时间序列中,随着许多非线性特性被发现,在时间序列结构中并入波动率的广义自回归条件异方差模型(GARCH)开始被应用。近年来,GARCH模型进一步发展,扩展出了很多变量。另外,在时间序列分析领域,例如k最近邻法,神经网络和支持向量机等非线性模型已经广泛应用于股票价格预测。这些模型不仅努力从学术上把握经济意义,而且努力在实践中提高预测准确性,它们通过反复试验来尝试掌握股价波动的模式,这些尝试在近几年已经引起人们对算力的重视。

第二类理论使用诸如公司属性之类的横截面数据执行横截面(回归)分析。 通过截面分析来解释股价的特征在金融领域被称为“因子”。 金融方面的许多实证研究已经确定了哪些股票的横截面特征相对增加,哪些股票价格下降。 解释横截面股票价格的代表性模型是Fama-French三因子模型。 模型指出,可以通过三个因子来解释股票收益的横截面结构:β(市场投资组合),规模(市场资本化)和价值(价格市价比)。 从那以后,除了Fama-French三因子模型中的因子外,其他因子也相继被发现。 到2012年发现的因子就多达300多个,而且,大多数这些因子是在最近10年中发现的。

尽管投资者需要考虑的因子在快速增长,但要同时测试超过300个因子,从维度的规模上将也是非常困难的。此外,由于不错的可操作性和结果的鲁棒性,线性回归模型还是在金融领域长期应用。但是,由于大量因子和股票收益关系的复杂性,线性回归模型在预测准确性上限制很大。就像很多非参数截面股票预测研究的那样,使用深度学习来非线性拟合各种因子相比简单拟合各种因子的线性回归,可以提高预测的准确性和股票盈利。

但是,这些研究仅限于每月的股票价格预测而且它们与实际的投资管理不符。 在这篇论文中,作者提出了一个使用每日股价横截面数据预测使用深度学习进行实际投资管理的框架,并且在日本股市进行实证分析,以确认框架的有效性。为了每天进行投资,作者会在实际投资时建立投资组合。 例如,在收市时段利用可用信息构建投资组合,然后在第二天开市时在市场上进行投资。 此外,投资组合周转率是计算并比较以考虑影响交易成本。 周转率高的投资组合与较低利率的投资组合相比,交易成本更高。

数据集

文章使用的数据集为TOPIX500成分股指数,TOPIX500覆盖了日本股市的大盘股和部分中盘股,同时这个指数也常作为海外投资机构投资日本股市的投资标的。

文章使用了33个因子,如下表:

在实践中,这些指标相对都用得比较多。

问题建模

作者把问题定义为了一个回归问题,这样就把问题转化成了寻找一个预测变量f,同时用均方误差(MSE)作为损失函数。定义t时刻训练模型的均方误差如下:

通过深度学习股价截面数据分析和预测股票价格相关推荐

  1. 时间序列深度学习:状态 LSTM 模型预测太阳黑子

    目录 时间序列深度学习:状态 LSTM 模型预测太阳黑子 教程概览 商业应用 长短期记忆(LSTM)模型 太阳黑子数据集 构建 LSTM 模型预测太阳黑子 1 若干相关包 2 数据 3 探索性数据分析 ...

  2. HyperAttentionDTI:基于注意机制的序列深度学习改进药物-蛋白质相互作用预测

    题目: HyperAttentionDTI: improving drug–protein interaction prediction by sequence-based deep learning ...

  3. 生物信息学|新颖的深度学习模型,更准确地预测药物-药物相互作用

    本篇推文引自:Novel deep learning model for more accurate prediction of drug-drug interaction effects 1. 摘要 ...

  4. python时间序列分析航空旅人_Python深度学习教程:LSTM时间序列预测小练习—国航乘客数量预测...

    Python深度学习教程:LSTM时间序列预测小练习-国航乘客数量预测 参考数据: 数据一共两列,左边是日期,右边是乘客数量 对数据做可视化:import math import numpy as n ...

  5. 【深度学习】使用Python+PyTorch预测野外火灾

    作者 | Aishwarya Srinivasan 编译 | VK 来源 | Towards Data Science 联合国在实现其可持续发展目标方面面临的主要障碍之一是与自然灾害作斗争,而造成巨大 ...

  6. 解析KDTCN:知识图谱和深度学习模型联合实现股票预测

    背景概述 今天看了一篇论文我觉得挺有意思,一方面是讲的股票预测相关,另一方面是把深度学习和知识图谱相结合解决一个问题.通常知识图谱和深度学习很少有交集,一般是独立发展的两个人工智能领域解决问题的手段, ...

  7. 《深度学习可直接从组织学预测胃肠道癌微卫星不稳定性》

    <Deep learning can predict microsatellite instability directly from histology in gastrointestinal ...

  8. 净迁移人口预测程序python_高质量深度学习模型, 一键模型预测,迁移学习很简单...

    飞桨(PaddlePaddle)核心框架Paddle Fluid v1.5已经发布,而作为其关键工具,用来迁移学习的PaddleHub也进行了全面更新,正式发布了1.0版本. 全新的PaddleHub ...

  9. Nat. Biotechnol. | 利用深度学习从基因转录数据中预测药物疗效

    作者 | 蒋长志 审稿 | 蒋立坤 今天给大家介绍来自北京大学医学部的谢正伟团队发表在Nature Biotechnology上的文章,文章提出了一种基于深度学习的药效预测系统(DLEPS),该系统将 ...

  10. 论文解读:基于共享混合深度学习架构的DNA形状特征预测转录因子结合位点

    Predicting transcription factor binding sites using DNA shape features based on shared hybrid deep l ...

最新文章

  1. 非关系型数据库-NoSQL(Redis)
  2. 医学图像分类_全面梳理:图像配准综述
  3. 编译安装Ruby 1.9.3 安装CentOS
  4. Puppet基础应用
  5. 关键时刻不可或缺的5款高科技紧急应用
  6. 了解令人困惑的物联网平台世界
  7. Alexa世界排名原理+作弊源码,为网站赢得好排名
  8. office WPS同时安装,WPS卸载后,文档图标异常解决办法
  9. 超级好用的流程图js框架
  10. 「GoTeam 招聘时间」传音移动互联 容器开发(上海)
  11. 计算机怎么样返回桌面,电脑如何快速返回桌面
  12. 效率神器 SCons 构建工具
  13. 中专计算机基础知识汇总,【职业中专计算机基础教育分析】 计算机基础知识...
  14. web系统多语言切换
  15. SAP开发框架系列之 自定义批次管理
  16. 高通平台蓝牙--安全issue
  17. OFBiz终于起航了
  18. Excel单元格黄色叹号 绿色三角形 去掉方法
  19. 人工智能会给普通人带来哪些改变
  20. 2019年12月中国编程语言排行榜

热门文章

  1. hprose for php,基于swoole的Hprose for PHP 开发后端API服务 实践
  2. 【深入理解Java原理】Java类加载机制
  3. python+django+mysql运动场地预约系统毕业设计毕设开题报告
  4. 数仓建模—建模工具PdMan
  5. 数字华容道的数学原理
  6. acm 程序设计大赛各种输入方式(python版)
  7. pthread_create创建线程后是否需要释放资源
  8. android 5.1 改mac地址,mac地址可以随便改吗
  9. nifi服务器间拷贝文件,NIFI Kerberos 认证
  10. cdrx4自动排版步骤_如何在CorelDRAW软件排版CDR怎么快速排版技巧?