引言:

上一篇文章,我们讲到有效因子的检验。在选择了有效因子之后,我们还需要进行一步去除冗余因子。

不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

主要步骤:

我参考了网络上不同的剔除方法,但都仅仅浅尝辄止,没有进行深入的代码探究。我们先说剔除冗余因子的主要步骤:

假设现有k个因子,回测周期可分为m个月,股票可均分为n个组合,

1、分别按不同因子的大小进行排序,讲股票分为n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高。分值赋给每月该组合内的所有个股。

如果组合10的收益大于组合1,那么就将组合 i 各个股票的各个股票分值设置为 i ,各个组合的分值从低到高进行排列分别是

1,2,3,4,5,6,7,8,9,10。如果组合1的收益大于组合10,那么正好是反过来 10,9,8,7,6,5,4,3,2,1。

2、按月计算个股的不同因子得分间的相关性矩阵。

3、在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值。

4、设定一个得分相关性阀值,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

测试参数:

我们根据步骤,在掘金平台上实现

测试参数声明:

测试平台:掘金量化

测试时间:2016-01-01——2018-01-01

测试股票池:“上证50”成分股

测试因子:

测试步骤:

1、获取每个月的首个交易日,月初获取每只股票的因子数据及当月收益率,根据因子数值排序,将股票分为10组,根据平均收益为股票组合打分,分值赋予对应组合中所有股票。

2、分别测试股票关于四种因子的分值,根据每月结果,计算相关性系数矩阵。

3、计算整个测试周期的相关性系数平均值。

4、设定阈值,剔除冗余因子。

结果:

我们看几个月份的相关性系数矩阵

2016年3月

2016年4月

2016年6月

2016年10月

2016年12月

2017年6月

再来看各个月的统计表格

我们经过统计,得出平均相关性系数矩阵

结论:

我们选取的四个有效因子,平均相关性系数均小于0.25,也就是我们选取的因子相关性很低,我们可以放心的进行因子间的组合,构建新的因子。

冗余因子剔除的思想:计算股票根据每个因子的所获得的分值,通过比较该分值,从而得到因子间的相关性,相关性高的,剔除其中一个,留下有效性高并与其他因子相关性低的因子。

查看冗余因子策略源码:https://www.myquant.cn/community/topic/695

来源:掘金量化myquant.cn   文/经纬量化 宋瑞笛   转载请注明出处!

PHP多因子方案,多因子策略之冗余因子相关推荐

  1. 多因子策略之冗余因子

    引言: 上一篇文章<多因子选股之有效因子>,我们讲到有效因子的检验.在选择了有效因子之后,我们还需要进行一步去除冗余因子. 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合 ...

  2. 基于夏普比率对因子的筛选,以及基于股票期货交易策略对多因子策略的机器学习算法探讨

    试论因子的筛选,股票期货策略,以及基于多因子策略的机器学习算法 前言 正文 股票因子的筛选 股票期货策略 基于多因子策略的机器学习 前言 之前参加泰迪杯的,但又没什么时间,自己又是python新手,量 ...

  3. 多因子选股模型python_什么是多因子量化选股模型?

    引言 量化投资中经常听到的"多因子模型"是个什么鬼?因子是影响因素的简称,或简单理解成指标.我们都知道股票收益受到多重因素的影响,比如宏观.行业.流动性.公司基本面.交易情绪等等. ...

  4. R语言ggplot2可视化条形图(bar plot)、配置因子变量的全局填充色方案、这样不同数据集相同因子的填充色具有一致性(Fix colors to factor levels)

    R语言ggplot2可视化条形图(bar plot).配置因子变量的全局填充色方案.这样不同数据集相同因子的填充色具有一致性(Fix colors to factor levels) 目录

  5. 数据分析--单因子选股策略、多因子选股策略(选股)

    数据分析--单因子选股策略.多因子选股策略(选股) 一.单因子选股策略--小市值策略 二.多因子选股策略--市值+ROE(净资产收益率)选股策略 一.单因子选股策略--小市值策略 因子选股策略 因子: ...

  6. 多因子策略_单因子选股轮动测试

    多因子策略 因子 因子就是在选择一只股票时,能够帮助你做出决定的一个因素 类型 规模因子 1. 总市值 2. 流通市值 3. 自由流通市值 4. 小市值因子(市值越小,其操纵涨跌所需要的资金越少,股票 ...

  7. 股票量化交易策略:多因子筛选练习

    一.多因子筛选阶段介绍 1. 筛选阶段的任务 基本面数据因子(特征)如此之多,那么如何去找到对应的对股票收益率比较好的.并且能在未来一段时间给我们的选股收益率提供帮助. 2.挖掘因子的过程 我们可以大 ...

  8. 因子择时的个标尺:因子动量因子离散度与因子挤

    转 因子择时的三个标尺:因子动量.因子离散度与因子拥挤度 关于因子择时,思路虽然是多样的但是总结下来无非是两个大方向. 第一个方向是"外生变量方法".在这个方向,我们的核心想法是基 ...

  9. java多因子认证,Milvus 实战|生物多因子认证系列 (二):人脸识别

    视觉 AI 作为一个已经发展成熟的技术领域,具有丰富的应用场景和商业化价值,全球 40% 的 AI 企业都集中在视觉 AI 领域.近年来,视觉 AI 除了在智能手机.智能汽车.智慧安防等典型行业中发挥 ...

  10. R语言主成分分析PCA和因子分析EFA、主成分(因子)个数、主成分(因子)得分、主成分(因子)旋转(正交旋转、斜交旋转)、主成分(因子)解释

    R语言主成分分析PCA和因子分析EFA.主成分(因子)个数.主成分(因子)得分.主成分(因子)旋转(正交旋转.斜交旋转).主成分(因子)解释 目录

最新文章

  1. 技本功丨请带上纸笔刷着看:解读MySQL执行计划的type列和extra列
  2. 从流感预测到智能决策,深度学习能帮企业做哪些事?
  3. 特别企划 | 或许是史上最萌的产品经理改需求姿势(多图)
  4. 程序员应对浏览器同源策略的姿势
  5. Ubuntu 找不到libc.so.6
  6. HTML统计用户浏览页面时间,如何使用JS代码计算用户浏览页面的时间呢?
  7. Evensgn 剪树枝 树规
  8. js+svg实现的一个环图
  9. python类:面向对象、继承、slot、多重继承
  10. SQL Server中, DateTime (日期)型操作的 SQL语法
  11. 三菱FX系列PLC-编程1
  12. 计算所与北大往事回顾
  13. Spark03:Spark安装部署【集群】:Standalone模式以及ON YARN模式
  14. 迈达斯导出html计算书,动态计算书模块功能-midas Civil 2011
  15. 得空写的基于web的工作流表单设计器,大家看看怎么样
  16. null和undefined的区别
  17. 抽取modelnet40_ply_hdf5_2048数据集的子类集制作h5点云
  18. Android应用测试方法总结
  19. HAL库之SYSTICK时钟频率探究-F407
  20. Linux-虚拟机ping不通主机

热门文章

  1. windows命令行下ftp连接超时的可能原因
  2. python100例详解-Python 经典算法100及解析(小结)
  3. fat,uat,pre等环境含义
  4. 微信小程序·实现列表页和详情页同步收藏
  5. ETL工具-Taskctl在Windows作业类型的使用(Soap服务驱动)
  6. POM文件详解(如何组织POM文件)
  7. Restsharp 与 unity3D WWW
  8. java实现线性填充空值_为什么我的Java字符串用空值填充?
  9. linux 解压 WinRAR 压缩文件
  10. matlab的开方算法_每天一个小算法(matlab armijo)