卷积神经网络项目是我在华泰实习的过程中做的一个项目,主要是用卷积神经网络来预测股票的走势,现在对项目做一个总结。

报告详情:

【华泰金工林晓明团队】人工智能选股之卷积神经网络——华泰人工智能系列之十五

测试流程包含如下步骤:

数据获取:

a)股票池:全A股。剔除ST股票,剔除每个截面期下一交易日停牌的股票,剔除上市3个月内的股票,每只股票视作一个样本。

b)回测区间:2011年1月31日至2019年1月31日。

特征和标签提取:每个自然月的最后一个交易日,计算82个因子暴露度,作为样本的原始特征,因子池如图表13和图表14所示。计算下一整个自然月的个股超额收益(以沪深300指数为基准),对于分类模型,选取下月收益排名前30%的股票作为正例(y = 1),后30%的股票作为负例(y = 0),作为样本的标签。对于回归模型,使用下个月的超额收益作为标签。

特征预处理和二维数据生成

a)中位数去极值:设第T期某因子在所有个股上的暴露度序列为 Di,DM为该序列中位数,DM1为序列|Di-DM|的中位数,则将序列Di中所有大于DM+5DM1的数重设为DM+5DM1,将序列Di中所有小于DM-5DM1的数重设为DM+5DM1;

b)缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为中信一级行业相同个股的平均值;

c)行业市值中性化:将填充缺失值后的因子暴露度对行业哑变量和取对数后的市值做线性回归,取残差作为新的因子暴露度;

d)标准化:将中性化处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从N(0, 1)分布的序列。

e)要使用卷积神经网络,需要提供二维的特征数据,我们按照图表3的形式,将某只股票多个截面期的因子数据组织成类似于图片的二维数据,总共82行(对应82个因子),5列(对应5个截面期),这样在每个月截面上,就可以得到上千张“股票图片”。

滚动训练集和验证集的合成:由于月度滚动训练模型的时间开销较大,本文采用年度滚动训练方式,全体样本内外数据共分为九个阶段,如下图所示。例如预测2011年时,将2005-2010年共72个月数据合并作为样本内数据集;预测T年时,将T-6至T-1年的72个月合并作为样本内数据。

样本内训练:使用卷积神经网络对训练集进行训练。

交叉验证调参:随机取10%样本内的数据作为验证集,在训练的同时观察卷积神经网络在验证集上的表现,当验证集上的loss达到最小时,停止训练。

样本外测试:确定最优参数后,以T月末截面期所有样本预处理后的特征作为模型的输入,得到每个样本的预测值f(x)。将预测值视作合成后的因子,进行单因子分层回测。

模型评价:我们以分层回测和构建选股策略的结果作为模型评价标准。

深度学习之利用卷积神经网络预测股票走势相关推荐

  1. 深度学习实战——利用卷积神经网络对手写数字二值图像分类(附代码)

    系列文章目录 深度学习实战--利用卷积神经网络对手写数字二值图像分类(附代码) 目录 系列文章目录 前言 一.案例需求 二.MATLAB算法实现 三.MATLAB源代码 参考文献 前言 本案例利用MA ...

  2. 深度学习入门——利用卷积神经网络训练CIFAR—10数据集

    CIFAR-10数据集简介 CIFAR-10是由Hinton的学生Alex Krizhevsky和Ilya Sutskever整理的一个用于普适物体的小型数据集.它一共包含10个类别的RGB彩色图片: ...

  3. 深度学习21天——卷积神经网络(CNN):实现mnist手写数字识别(第1天)

    目录 一.前期准备 1.1 环境配置 1.2 CPU和GPU 1.2.1 CPU 1.2.2 GPU 1.2.3 CPU和GPU的区别 第一步:设置GPU 1.3 MNIST 手写数字数据集 第二步: ...

  4. 深度学习教程(10) | 卷积神经网络解读(吴恩达·完整版)

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/35 本文地址:http://www.showmeai.tech/article-det ...

  5. 深度学习(DL)与卷积神经网络(CNN)学习笔记随笔-03-基于Python的LeNet之LR

    原地址可以查看更多信息 本文主要参考于:Classifying MNIST digits using Logistic Regression  python源代码(GitHub下载 CSDN免费下载) ...

  6. 【深度学习系列】卷积神经网络CNN原理详解(一)——基本原理(1)

    上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...

  7. 记录|深度学习100例-卷积神经网络(CNN)彩色图片分类 | 第2天

    记录|深度学习100例-卷积神经网络(CNN)彩色图片分类 | 第2天 1. 彩色图片分类效果图 数据集如下: 测试图1如下 训练/验证精确图如下: 优化后:测试图--打印预测标签: 优化后:测试图- ...

  8. 深度学习之 10 卷积神经网络2

    本文是接着上一篇深度学习之 10 卷积神经网络1_水w的博客-CSDN博客 目录 1 出现原因 2 一般结构框架 (1)一般结构框架:卷积层 --利用卷积核提取特征 卷积核的本质: 总结 特征图可视化 ...

  9. Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类)

    Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类) 1.卷积神经网络 1.1卷积神经网络简介 1.2卷积运算 1.3 深度学习与小数据问题的相关性 2.下载数据 2.1下载原始数据 ...

最新文章

  1. 骑士卡:基于Kafka搭建消息中心,上亿消息推送轻松完成
  2. iOS 字符串加密至MD5
  3. NIO详解(三):IO多路复用模型之select、poll、epoll
  4. zephyr 测试框架
  5. 《挖掘管理价值:企业软件项目管理实战》一2.4 软件设计过程
  6. c++并发编程实战_Java 并发编程实战:JAVA中断线程几种基本方法
  7. Linux系统中的CPU利用率
  8. 解析Disruptor的依赖关系
  9. 8月第一周IT类网站/频道排名:天极网跃居第三
  10. day09 CDN绕过漏洞回链接口探针全网扫描反向邮件
  11. 算法:(BFS)迷宫寻路算法
  12. android 获取经纬度的三种方法,Android中如何获取经纬度
  13. 关于deepin-wine或wine更换字体方法
  14. 特征重要性判断(一)----决策树
  15. 硬盘突然变raw格式_硬盘变成raw格式的解决方法详解
  16. Deepin系统个人评测
  17. ZAO换脸App被微信屏蔽,授权APP请谨慎
  18. python爬虫网页超链接_Python爬虫获取网页上的链接
  19. WEB前端开发 » WAP页面制作需要注意的几点
  20. UtoVR Player免费360VR视频播放器

热门文章

  1. 飞桨实战营-图像分割学习笔记和心得体会
  2. 凝思操作系统ip配置文件interfaces与实际IP不符
  3. 跟着小程学微服务-Mock自动化系统的原理及实现
  4. 我眼中的未来计算机和互联网–读《文明之光》第三冊有感
  5. Zookeeper学习:Zookeeper应用场景之分布式锁
  6. Shell进阶必会的几个工具,你都掌握了吗?(附真实企业面试题)
  7. 【NDK】【019】NDK使用cmath库
  8. 运维常说的 5个9、4个9、3个9 的可靠性
  9. 基于数据驱动设计复杂页面
  10. cla无证书认证_一年制留服认证研究生