今天我们为大家带来最新的研报内容,来自广发证券金工团队的《风险中性的深度学习选股策略》。下面让我们来一起学习吧!https://mp.weixin.qq.com/s?__biz=MzAxNTc0Mjg0Mg==&mid=2653288319&idx=1&sn=e2be2ffda6b8c63f46a966790e8147ad&chksm=802e356ab759bc7c9a607ffb2145a020b454b2a97dac956684d484d5ed8bba5b09770d049dab#rd​mp.weixin.qq.com

风险中性的机器学习选股模型

模型训练:通过训练样本,确定模型结构,优化模型参数。

预测输出 Y 的维度:3。

输入特征 X 的维度:156(128个因子+28个行业) 通过网格搜索获取最优的模型结构。

选取模型结构为: 156(输入层)-512-200-200-200-128-3(输出层) 即一共包含5个隐层。

隐层节点数依次为:512(隐层1)、 200(隐层2)、 200(隐层3)、 200(隐层4)、 128(隐层5)。

提高深层神经网络选股性能的主要方法:1、采用relu等激活函数。

2、将优化目标函数MSE改成交叉熵。

3、Batch normalization技术。

4、Dropout技术。

采用Keras作为机器学习平台:1、可以选择Tensorflow、CNTK、Theano(目前已经停止更新)作为后端。

2、目前已经支持多GPU。

3、显卡选择:Nvidia GTX Titan XP, GTX 1080Ti, GTX Titan, GTX 1080, GTX1070, GTX 1060。

机器学习多因子选股模型:从股票特征中提取信息,对股票未来的收益进行预 测,选出能够产生超额收益的股票组合。

多因子选股模型:

挑选出未来一期能够产,生超额收益的股票。

↓↓↓

风险中性的多因子选股模型:

挑选出未来一期,在剥离风险因子影响后,能够产生的超额收益的股票。

如何实现上述目标? 针对具体的应用场景,构建适当的机器学习预测模型。

普通的样本标注方法

训练时,根据未来一期的股票涨跌幅来给样本贴“标签”:上涨、下跌、平盘同一时刻,按照涨跌幅进行排序,确定样本的输出标签。

行业中性的样本标注:寻找不同行业内能够跑出超额收益的股票

训练时,根据未来一期的股票涨跌幅来给样本贴“标签”:上涨、下跌、平盘 同一时刻,按照涨跌幅进行排序,确定样本的输出标签。

市值中性的样本标注:寻找不同市值区间内能够跑出超额收益的股票

训练时,根据未来一期的股票涨跌幅来给样本贴“标签”:上涨、下跌、平盘 同一时刻,按照涨跌幅进行排序,确定样本的输出标签。

风险中性的样本标注:更一般的方法

未来一期股票收益率对风险因子做线性回归,获得残差,按残差进行样本标注

策略与实证分析

策略流程

数据预处理

因子标准化:1、异常值、缺失值处理

2、极值压边界处理

3、沿时间方向的因子标准化

4、沿截面的因子标准化

5、按照机器学习模型来调整因子分布

风险中性的深度学习选股模型的IC

IC的平均值为0.082,标准差为0.108。

深度学习因子与流通市值的相关性:IC序列的相关性

经过行业和市值中性化之后,深度学习因子更少受到市值因子的影响。

深度学习因子与流通市值的相关性:截面相关性

经过行业和市值中性化之后,深度学习因子更少受到流通市值因子的影响。

回测参数设置调仓周期:10个交易日

股票池:中证500成份股,剔除ST股票,剔除交易日停牌和涨停、跌停的股票

超配组合:调仓时分10档,等权买入深度学习模型打分最高的一档

对冲基准:中证500指数

原始因子数据:估值因子、规模因子、反转因子、流动性因子、波动性因子、技术 指标,共计128个因子,以及28个行业0-1变量

风险因子:行业、流通市值

深度学习模型训练:每半年滚动更新模型,采用最近4年的样本作为训练集

策略回测:2011年1月-2018年4月30日

交易成本:千分之三

普通的深度学习选股策略

2011年以来,年化收益率19.71%,最大回撤 -5.35%,胜率为 69.5%,信息比2.47。

风险中性的深度学习选股策略

2011年以来,年化收益率21.95%,最大回撤 -5.03%,胜率为 74.6%,信息比2.92。

风险中性深度学习选股策略

年化收益率21.95%,最大回撤 -5.03%,胜率为 74.6%,信息比2.92

普通深度学习选股策略

年化收益率19.71%,最大回撤 -5.35%,胜率为 69.5%,信息比2.47

机器学习策略表现的同质性:不同策略的表现有一定的相关性

用普通深度学习模型的IC对风险中性深度学习模型的IC进行回归,R方为0.84。 说明两种策略的表现有较强的相关性。

机器学习策略每期组合的同质性:选取的组合有较大的差异

当组合规模N为50时,两种深度学习选股策略平均每期选到的股票有41.9%重合。(参考:两次独立的随机选股中,平均有10%重合。)

当组合规模N为100时,两种深度学习选股策略平均每期选到的股票有53.3%重合。(参考:两次独立的随机选股中,平均有20%重合。)

总结将风险因子中性化处理后,可以构建新的深度学习选股模型,该模型受风险 因子的影响较小。

2011年以来,中证500内选股对冲策略年化收益率21.95%,最大回撤 - 5.03%,胜率为 74.6%,信息比2.92。

即使是采用同样的特征和模型结构,风险因子中性化之后,训练的策略也会 有较大的差别,可以通过此方法丰富深度学习选股策略的多样性。本文旨在对所研究问题的主要关注点进行分析,因此对市场及相 关交易做了一些合理假设,但这样会导致建立的模型以及基于模型所得 出的结论并不能完全准确地刻画现实环境。而且由于分析时采用的相关 数据都是过去的时间序列,因此可能会与未来真实的情况出现偏差。本 文内容并不是适合所有的投资者,客户在制定投资策略时,必须结合自 身的环境和投资理念。

知识在于分享

在量化投资的道路上

你不是一个人在战斗

证券投资深度学习_基于风险中性的深度学习选股策略相关推荐

  1. 多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏

    大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...

  2. 风险中性的深度学习选股策略

    一.数据驱动型机器学习模型的问题 目前流行的机器学习方法,包括深度学习,大部分是数据驱动的方法,通过对训练集数据学习来提取知识.数据驱动型机器学习方法应用成功的前提是:从训练集数据中学习到的" ...

  3. C#上位机基础学习_基于SOCKET实现与PLC服务器的TCP通信(二)

    C#上位机基础学习_基于SOCKET实现与PLC服务器的TCP通信(二) 测试软件: TIA PORTAL V15.1 S7-PLCSIM ADVANCED V3.0 Visual Studio 20 ...

  4. 三维重建 几何方法 深度学习_基于深度学习的三维重建算法:MVSNet、RMVSNet、PointMVSNet、Cascade系列...

    欢迎关注微信公众号"3D视觉学习笔记",分享博士期间3D视觉学习收获 MVSNet:香港科技大学的权龙教授团队的MVSNet(2018年ECCV)开启了用深度做多视图三维重建的先河 ...

  5. ipad如何分屏_基于ipad的生态型无纸化学习说明书

    设施清单 硬件: ipad2018 ➕保护套 apple pencil✏️(一代) iphone8 :1⃣️配合app实现文件扫描,然后隔空投送至iPad上:2⃣️通过笔记类app的iCloud同步功 ...

  6. 大数据基石python学习_资源 | 177G Python/机器学习/深度学习/算法/TensorFlow等视频,涵盖入门/中级/项目各阶段!...

    原标题:资源 | 177G Python/机器学习/深度学习/算法/TensorFlow等视频,涵盖入门/中级/项目各阶段! 这是一份比较全面的视频教程,基本上包括了市面上所有关于机器学习,统计学习, ...

  7. python小车行驶路线图_基于opencv-Python小车循线学习笔记

    基于opencv-Python小车循线学习笔记 加入摄像头模块,让小车实现自动循迹行驶 思路为:摄像头读取图像,进行二值化,将白色的赛道凸显出来 选择下方的一行像素,黑色为0,白色为255 找到白色值 ...

  8. ros订阅相机深度信息_基于深度相机 RealSense D435i 的 ORB SLAM 2

    相比于上一篇文章,这里我们将官方给的 rosbag 数据包替换为来自深度相机的实时数据.之所以选择 Intel RealSense 这款深度相机,仅仅是因为它是最容易买到的...在京东上搜" ...

  9. 文献学习(part9)--基于模型分解的小样本学习

    学习笔记,仅供参考,有错必究 从文献中按照本人的学习情况不完全摘录: 文章目录 基于模型分解的小样本学习 摘要 引言 小样本学习问题 本文思路 迁移学习与元学习 基于模型分解的小样本学习 摘要 机器学 ...

最新文章

  1. R语言使用magick包的image_border函数和image_background函数自定义图像的边界和背景(Change image border and background)
  2. agv调度matlab程序,一种分布式AGV调度方法及调度系统与流程
  3. mysql 表分区 django_MySQL partition分区I
  4. 排序算法_桶排序(箱排序)
  5. IIS上的web service调用AX服务问题
  6. easyui关机图标_如何在Windows 10中创建关机图标
  7. Hibernate查询用法总结
  8. win10 64位下Oracle10g安装
  9. SqList顺序表实现笔记
  10. Flutter Connection to **** was not upgraded to websocket
  11. 列宽一字符等于多少厘米_Excel中行高多少等于1厘米?列宽多少等于1厘米?-列宽为2厘米...
  12. 速成KeePass全局自动填表登录QQ与迅雷(包括中文输入法状态时用中文用户名一键登录)...
  13. 排序算法--鸽巢排序(PigeonholeSort)的原理、排序思路、适用场景及代码示例
  14. 【APICloud系列|31】成功上架5个应用商店总结(腾讯应用宝、阿里应用分发平台、华为开发者联盟、小米开放平台、百度开放平台)
  15. SONY WH-1000XM3 User Guide
  16. mybatis定义别名
  17. 猿人学web端爬虫攻防平台第七题动态字体
  18. 再谈防火墙的流量控制
  19. 改了计算机名oracle,修改计算机名称导致Oracle的em不能用
  20. 原神要求特别多的作家千来神祠栖木在哪

热门文章

  1. oracle磁带的使用期限,存储的损耗 关于磁带寿命的一些探讨
  2. 07 PCA(主成分分析)之梯度上升法
  3. 程序员必备狂拽炫酷吊炸天的动效神器
  4. 基于EasyNVR网络摄像机无插件直播流媒体服务器实现文字滤镜处理功能
  5. 区块链学习笔记二之区块链的加密技术
  6. 《如何阅读一本书》—[美]莫提默.J.艾德勒、查尔斯.范多伦
  7. 帅哥陈 Hololens开发笔记(1)
  8. 什么是射频中经常提到的IQ信号?
  9. max3490esa_MAX3096ESE+T_maxim芯片后缀tg16是什么意思
  10. 解决$ is not defined 的几种方法