论文 | 深度学习股票预测
作者:chen_h
微信号 & QQ:862251340
微信公众号:coderpai
论文链接:Deep learning networks for stock market analysis and prediction
摘要
作者考虑了两个主要问题:
- 仅使用日内市场数据预测日内股票回报;
- 使用预测的股票收益预测协方差矩阵;
数据集
数据集由来自韩国 KOSPI 的38种股票组成,每5分钟取样一次。数据收集的日期范围是 2010-01-04 至 2014-12-30 。首先将 80% 的样本(2010-01-04 至 2013-12-24)用于训练。在每个时间戳,该算法访问每个数据的最后 10 个对数收益。对数收益计算公式为 rt=ln(St/St−Δt)r_{t} = ln(S_{t} / S_{t - \Delta t})rt=ln(St/St−Δt) ,其中 StS_{t}St 是股票在 t 时刻的价格,Δt\Delta tΔt 表示 5 分钟。该样本包含每个股票的总共 1239 个交易日和 73041 个五分钟的回报。
数据预处理
作者探索了各种预处理技术。预处理数据在预测阶段被输入到神经网络。
- RawData:没有预处理,38*10 大小的矢量数据;
- PC200:输出维度为 200 的 PCA;
- PC380:输出维度为 380 的PCA;
- AE400:输出维度为 400 的稀疏自动编码器;
- AE800:输出维度为 800 的稀疏自动编码器;
日内股票收益预测方法
将具有 2 个隐藏层的神经网络与具有 10 个滞后变量的单变量自回归模型进行比较。隐藏层的大小分别为 200 和 100。由于这是一个回归模型,最终输出是一个标量。
h1=ReLU(W1ut+b1)h_{1} = ReLU(W_{1}u_t+b_1)h1=ReLU(W1ut+b1)
h2=ReLU(W2h1+b2)h_2=ReLU(W_2h_1+b_2)h2=ReLU(W2h1+b2)
r^i,t+1=W3h2+b3\hat r_{i,t+1} = W_{3}h_2+b_3r^i,t+1=W3h2+b3
股票回报结果
Method | NMSE |
---|---|
AR(10) | 0.9655 |
ANN (RawData) | 0.9937 |
DNN (RawData) | 0.9629 |
DNN (PCA380) | 0.9660 |
DNN (RBM400) | 0.9702 |
DNN (AE400) | 0.9638 |
NMSE 是归一化的均方误差,定义为:
NMSE=1N∑n=1N(rt+1n−r^t+1n)2var(rt+1n)NMSE = \frac{1}{N} \frac{\sum^{N}_{n=1}(r^{n}_{t+1}-\hat r^{n}_{t+1})^2}{var(r^{n}_{t+1})}NMSE=N1var(rt+1n)∑n=1N(rt+1n−r^t+1n)2
其中,var 表示方差。
总结
结果肯定有点令人沮丧,但是,这也并不奇怪。我自己对A股日内数据做实验的时候,也有类似结果。较高频率的日内数据的根本问题是数据中内置的大量噪声。通过使用神经网络简单的增加模型容量并不能解决这个问题。
论文 | 深度学习股票预测相关推荐
- 大数据毕设选题 - 深度学习股票预测系统(python Django)
文章目录 0 前言 1 课题背景 2 实现效果 3 Django框架 4 数据整理 5 模型准备和训练 6 最后 0 前言
- 深度学习时间序列预测:GRU算法构建单变量时间序列预测模型+代码实战
深度学习时间序列预测:GRU算法构建单变量时间序列预测模型+代码实战 GRU(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network, RNN)的一种 ...
- 深度学习时间序列预测:GRU算法构建多变量时间序列预测模型+代码实战
深度学习时间序列预测:GRU算法构建多变量时间序列预测模型+代码实战 注意参考:深度学习多变量时间序列预测:GRU算法构建单变量时间序列预测模型+代码实战 GRU(Gate Recurrent Uni ...
- 一文了解深度学习实战——预测篇
本文将从四个案例 房价预测.泰坦尼克号生还预测.股票预测.影评情感预测 入手,让童鞋们从实战角度快速入门深度学习的预测部分! 目录 房价预测 基于决策树回归器(DecisionTreeRegresso ...
- 基于python语言,使用爬虫和深度学习来预测双色球(二、模型训练与测试)
在上一篇博文中(基于python语言,使用爬虫和深度学习来预测双色球(一.数据的准备)),我们完成了数据的准备,通过爬虫的方式将2003年至今的每一期的中奖数据保存到了txt文件中,那么我们现在就开始 ...
- 一文搞定深度学习建模预测全流程(Python)
作者 | 泳鱼 来源 | 算法进阶 本文详细地梳理及实现了深度学习模型构建及预测的全流程,代码示例基于python及神经网络库keras,通过设计一个深度神经网络模型做波士顿房价预测.主要依赖的Pyt ...
- 深度学习时间序列预测:LSTM算法构建时间序列单变量模型预测大气压( air pressure)+代码实战
深度学习时间序列预测:LSTM算法构建时间序列单变量模型预测大气压( air pressure)+代码实战 长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主 ...
- 深度学习时间序列预测:卷积神经网络(CNN)算法构建单变量时间序列预测模型预测空气质量(PM2.5)+代码实战
深度学习时间序列预测:卷积神经网络(CNN)算法构建单变量时间序列预测模型预测空气质量(PM2.5)+代码实战 神经网络(neual networks)是人工智能研究领域的一部分,当前最流行的神经网络 ...
- 深度学习时间序列预测:LSTM算法构建时间序列单变量模型预测空气质量(PM2.5)+代码实战
深度学习时间序列预测:LSTM算法构建时间序列单变量模型预测空气质量(PM2.5)+代码实战 # 导入需要的包和函数: from __future__ import print_function im ...
- DL之随机性:理解和探究采用深度学习算法预测时导致多次运行结果不一致的问题
DL之随机性:理解和探究采用深度学习算法预测时导致多次运行结果不一致的问题 目录 理解和探究采用深度学习算法预测时导致每次运行结果不一致的问题
最新文章
- 旷视提出AutoML新方法,在ImageNet取得新突破 | 技术头条
- Android事件分发机制详解
- 经典PV操作问题 [转]
- ThinkPHP微信实例——JSSDK图像接口多张图片上传下载并将图片流写入本地
- 网络营销外包——网络营销外包公司表示网站更新仅仅是原创还不够
- php链接远程socket,php使用socket获取远程图片
- [要记的]excel中把字母变为数字
- 7-1 两个有序链表序列的合并 (15 分)
- Fragment 和 FragmentActivity的使用(二)
- 通过mapreduce把mysql的数据读取到hdfs
- 【渝粤教育】21秋期末考试网络市场调查与预测10143k2
- Ubuntu开机直接进入tty1,无法直接进入的图形化界面的解决方法
- 轻量化安装 TKEStack:让已有 K8s 集群拥有企业级容器云平台的能力
- 156 13.67用matlab答案,matlab数学实验答案_(胡良剑)版本
- 软件测试工程师面试题之数据库
- 11.2.0.3 RAC数据库m000进程报错ORA-04031错误的解决
- 婚恋交友诈骗案例,交友要谨慎
- 直流无刷电机仿真分析——基于simulink官方例程BLDC Speed Control
- java reflection 作用,全方位解读Java反射(reflection)
- 一分钟搞懂精度,错误率、查准率、查全率