未经授权,严禁转载

前言

本文沿用 Qian 的最优化体系获取因子权重,与之不同的是,我们将优化目标由最大化复合因子 IC_IR 变为最大化复合因子单期 IC。通过多个例子的实证研究发现,最大化单期IC能有效解决“等权”的配置偏差问题,在绝大部分因子空间,最优 IC 加权所构建的组合,其表现均优于按照“等权”方式所构建的组合。

研究目的

本文参考广发证券研报《从最大化复合因子单期 IC 角度看因子权重》,根据研报分析,现阶段应用较多的因子加权方法主要有以下几种: 等权加权、 IC 加权和 IC_IR 加权、以及最优化 IC_IR 加权。其中,等权加权是因子加权最传统的方法,这种方法受因子之间有效性差异、线性相关性影响明显。而 IC 加权、 IC_IR 加权对等权方式忽视了因子有效性差异的问题进行了改进,在大部分情况下会优于等权加权形式。最大化复合因子 IC_IR 加权已运用较广。

研究内容

(1)传统因子加权方式的局限性: 选择 ZZ800 为股票池,以市值因子和营业利润同比增长率为例,分析等权加权与 IC 加权的差异,根据回测结果分析两种因子加权方式的效用;

(2)设计最大化复合因子单期 IC 的理论最优比例: 本文沿用 Qian 的最优化体系获取因子权重,与之不同的是,我们将优化目标由最大化复合因子 IC_IR 变为最大化复合因子单期 IC。理论解析解的形式表明,最大化复合因子单期 IC 的权重与两方面因素有关: 一是因子的有效性,即因子 IC; 二是因子之间的相关系数。

(3)最大化复合因子单期 IC 的应用: 本文通过例子实证研究发现,最大化单期 IC 能有效解决“等权”的配置偏差问题,在绝大部分因子空间,最优 IC 加权 所构建的组合,其表现均优于按照“等权”方式所构建的组合。

研究结论

(1)通过对市值因子与营业利润同比增长率为例进行分析,IC 加权对等权方式忽视了因子有效性差异的问题进行了改进,在大部分情况下会优于等权加权形式。

(2)本文沿用 Qian 的最优化体系获取因子权重,与之不同的是,我们将优化目标由最大化复合因子 IR 变为最大化复合因子单期 IC,并根据该方法进行因子权重的计算。理论解析解的形式表明,最大化复合因子单期 IC 的权重与两方面因素有关: 一是因子的有效性,即因子 IC; 二是因子之间的相关系数。

(3)通过以下 7 个因子: 市盈率(PB)、市净率(PE)、市销率(PS)、营业利润同比增长率、资产负债率、反转(前 1 月累计收益)、换手率(前 10 个交易日日均换手率),进行不同因子加权方法的测试。文章实证结果也表明,最大化单期 IC 能有效解决“等权”的配置偏差问题,在绝大部分情况,最优 IC 加权所构建的组合,其表现均优于“等权”方式 所构建的组合,最大化单期 IC 能够获得最佳的结果。

>>> 因子等权加权

1.1 日期列表获取

在每个月的月末对因子数据进行提取,因此需要对每个月的月末日期进行统计。

输入参数分别为 peroid、start_date 和 end_date,其中 peroid 进行周期选择,可选周期为周(W)、月(M)和季(Q),start_date和end_date 分别为开始日期和结束日期。

函数返回值为对应的月末日期,如选取开始日期为 2017.1.1,结束日期为 2018.1.1。

1.2 股票列表获取

股票池: ZZ800 股票筛选: 剔除 ST 股票,剔除上市 3 个月内的股票,每只股票视作一个样本 以 ZZ800 为例,取 2016-08-31 当天的股票成分股

1.3 数据获取

本章旨在分析因子等权加权回测效果,股票选为 ZZ800,回测时间为 2013.1.1 至 2018.1.1,因子选定为市值和营业利润同比增长率,在每个月最后一个自然日,获取当前最新的因子数据以及对应的股票超额收益。

1.4 数据分析

考虑一个包含市值、营业利润同比增长率的两因子模型,本章分别基于两种加权方式计算复合因子值,然后选择复合因子值最高的 100 只股票构建组合。其中,组合 1 为等权组合,即市值和营业利润同比增长率按照等权的方式加总为复合因子; 组合 2 为 60/40 组合,即市值和营业利润同比增长率因子的加权比例分别为 60%、40%。

股票池: ZZ800,剔除 ST 股票以及上市 3 个月内的股票 对比基准: ZZ800 交易费用: 千分之 1.5 调仓周期: 月

第一张图统计了两因子等权组合及 60/40 组合的净值曲线图,上表统计了两个组合的超额收益指标对比。从中可看出,提高了市值权重的60/40 组合,收益率高于等权组合,同时风险(最大回撤、年化波动率)也高于等权组合。此外,从月度角度来看,等权因子组合和 60/40 组合的稳定性都非常高。

>>> 因子IC加权

2.1 因子 IC 分析

对比市值和营业利润同比增长率的 IC 序列统计特征可发现,市值因子的IC均值(0.09)明显优于营业利润同比增长率(0.028),同时前者IC 序列的波动性也高于后者。从 IR 来看,市值因子效果更好,这种效果相差明显的情况下,简单的等权加权并不能体现市值因子的强有效选股效应,从而拖累了多因子组合的表现。

2.2 因子 IC 等权组合分析

第一张图统计了两因子等权组合、60/40 组合以及 IC 加权因子组合的净值曲线图,上表统计了这三个组合的超额收益指标对比。从中可看出, 出IC 加权组合的收益率明显高于等权组合以及60/40 组合,同时风险(最大回撤、年化波动率)也高于等权组合以及 60/40 组合。但是从夏普比率来看,因子 IC 加权组合的收益风险比高于其余两个组合。从月度收益来看,因子 IC 加权组合的月胜率为 85%,可见模型收益稳定性得到进一步提高。

进一步分析发现,在市值、营业利润同比增长率的例子中,两因子按照 IC 加权的权重分别为 76.90% 和 23.10%;市值因子的权重高于等权形式,也高于主观的 60/40 组合。也就是说,因子 IC 加权组合增加了收益高、波动大的“市值因子”权重,减少了收益低、波动小的“营业利润同比增长率”权重,从而使得 IC 加权组合的整体收益、波动均高于等权组合。

>>> 最大化复合因子单期IC

3.1 理论最优比例的计算

由前面的分析可知,在对因子加权时,需考虑因子本身的有效性(IC),但因子 IC 加权并非在所有情况下都优于等权组合。那么,从理论上看若以最大化复合因子单期 IC 为目标,最优加权比例与哪些因素相关呢?

假设有 M 个因子,分别为 F1、F2、…、Fm,它们基于权重序列W=(w1,…,wm)加总为复合因子Fc,即

按照前面的说明,我们最优化的目标函数为:

假设两因子横截面协方差为:

相应的协方差矩阵为

同时对每一期的因子值进行标准化处理,使得因子标准差变为1,则上面的复合因子IC可简化为如下形式:

从上面的解析式可看出,最大化复合因子单期IC 的理论最优权重与两方面的因素有关:因子之间的协方差,以及因子IC。为说明相关系数(协方差)与最优权重的关系,我们以两因子模型的例子进行说明。在一个只包含两个因子的模型中,上述等式可以简化如下形式:

从上面的简化形式可以看出,若两因子为正相关关系,则相比于 IC 加权,最优 IC 加权方式会增加有效性更高(即 IC 更大)的因子权重;若两因子为负相关关系,则最优 IC 加权会增加有效性相对较低的因子权重,以稳定组合的收益。

3.2 组合测试

接下来,利用前一部分推导的最优 IC 加权方式,针对 7 个因子构建多因子模型: 市盈率(PB)、市净率(PE)、市销率(PS)、营业利润同比增长率、资产负债率、反转(前 1 月累计收益)、换手率(前 10 个交易日日均换手率)。每个月最后一个自然日,获取这 7 个因子数据以及下个月相对 ZZ800 的超额收益。为综合比较前文所提及的三种加权方式,在此部分的应用中我们仍然构建 3 个组合进行对比,分别是因子等权组合、因子 IC 加权以及最优 IC 加权组合。

股票池: ZZ800,剔除 ST 股票以及上市 3 个月内的股票 对比基准: ZZ800 交易费用: 千分之 1.5 调仓周期: 月

在上述 7 个因子的例子中,回测时间在 2013 - 2018,等权组合的年化超额收益为 19.87%,但夏普比率较低,为1.00。因子 IC 加权组合的收益表现略优于等权组合,年化收益增加至 22.27%,夏普比率也比其更高,为 1.09。三个组合中表现最好的是最优 IC 加权组合,其年化超额达 23.61%,夏普比率在三种也是最高,为 1.17。

总结

目前而言,应用较多的因子加权方法主要有以下几种: 等权加权、IC 加权和 IC_IR 加权、以及最优化 IC_IR 加权。其中,等权加权是因子加权最传统的方法,这种方法受因子之间有效性差异、线性相关性影响明显。而 IC 加权对等权方式忽视了因子有效性差异的问题进行了改进,在大部分情况下会优于等权加权形式。

Qian 在《Quantitative Equtiy Portfolio Management》一书中提出以最大化复合因子 IC_IR 获得因子权重,综合考虑了因子的 IC 大小以及 IC 时间序列的稳定性,目前已有许多文章对此种加权方式进行了测试。

本文沿用 Qian 的最优化体系获取因子权重,与之不同的是,我们将优化目标由最大化复合因子 IR 变为最大化复合因子单期 IC。理论解析解的形式表明,最大化复合因子单期 IC 的权重与两方面因素有关: 一是因子的有效性,即因子 IC;二是因子之间的相关系数。同时,文章实证结果也表明,最大化单期 IC 能有效解决“等权”的配置偏差问题,在绝大部分因子空间,最优 IC 加权所构建的组合,其表现均优于“等权”方式 所构建的组合。

点击【阅读原文】,查看研究原码~

从最大化复合因子单期IC角度看因子权重相关推荐

  1. Momenta 陈凯:从人才角度看 L4 无人驾驶的实现 | AI 研习社职播间第 4 期(附 Momenta 招聘解读)...

    雷锋网 AI 科技评论按:目前全球汽车行业公认由美国高速公路安全管理局(NHTSA)和国际自动机工程师学会(SAE)提出的的分级制度,把自动驾驶分成 L0 到 L5 级,分别承担相应的职责,而 L4 ...

  2. 【2015年第4期】大数据时代的数据挖掘 —— 从应用的角度看大数据挖掘(下)...

    大数据时代的数据挖掘 -- 从应用的角度看大数据挖掘(下) 李 涛1,2,曾春秋1,2,周武柏1,2,周绮凤3,郑 理1,2 1. 南京邮电大学计算机学院 南京 210023:2. 美国佛罗里达国际大 ...

  3. 【2015年第4期】大数据时代的数据挖掘 —— 从应用的角度看大数据挖掘(上)...

    大数据时代的数据挖掘 -- 从应用的角度看大数据挖掘 李 涛1,2,曾春秋1,2,周武柏1,2,周绮凤3,郑 理1,2 1. 南京邮电大学计算机学院 南京 210023:2. 美国佛罗里达国际大学 迈 ...

  4. 2015年《大数据》高被引论文Top10文章No.2——大数据时代的数据挖掘 —— 从应用的角度看大数据挖掘(下)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.2, ...

  5. 2015年《大数据》高被引论文Top10文章No.2——大数据时代的数据挖掘 —— 从应用的角度看大数据挖掘(上)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.2, ...

  6. 从项目管理角度看马谡失街亭

    一说到街亭,大家第一印象就是诸葛亮识人不明,马谡纸上谈兵,贪功冒进,自作主张上山想居高临下,结果水源切断被张郃击败,导致第一次北伐功败垂成.但是读了三国演义后,很多人一定会有这么几个问题: 为什么不派 ...

  7. 万字长文干货,面试官角度看招聘

    ????  这是第 53 篇不掺水的原创,想要了解更多,请戳上方蓝色字体:政采云前端团队 关注我们吧- 本文首发于政采云前端团队博客:万字长文干货,面试官角度看招聘 https://www.zoo.t ...

  8. 面试官角度看应聘:问题到底出在哪?(下)

    作者简介:堂主,2006 年开始沉迷前端领域.工作历经淘宝前端开发团队.蘑菇街前端团队,现为政采云前端团队(ZooTeam)负责人,好烟不好酒,半个茶人. 本篇是<面试官角度看应聘:问题到底出在 ...

  9. XLNet 发明者杨植麟:从学习的角度看NLP现状与未来(附PPT下载)

    近年来,基于Transformer的一系列大规模预训练模型不断推进NLP领域前沿,也持续冲击着大众和研究者关于NLP任务的认知.GPT-3在多项任务上取得的泛用能力似乎使人们看到了实现通用人工智能的曙 ...

  10. 一般向量空间的基变换_从希尔伯特空间的角度看线性变换的一般思想和问题

    一般线性变换以及傅里叶变换,欧氏变换,仿射变换,余弦变换,小波变换,拉普拉斯变换,Z变换,希尔伯特变换等等这些所谓的变换太多了,这些到底搞得是什么?怎么像云像雾又像风呢?怎么才能彻底理解它们?它们究竟 ...

最新文章

  1. 思考:固态硬盘的普及,是否影响到了存储引擎的设计?
  2. linux c用open打开(创建)一个文件
  3. java DOM4J 读取XML
  4. 进程之间通信 共享内存
  5. 作者:周武柏,男,美国佛罗里达国际大学计算机科学博士生,南京邮电大学计算机学院大数据项目组成员。...
  6. 这说明什么?【转载】早点长大的飞秋2013
  7. Esfog_UnityShader教程_UnityShader语法实例浅析
  8. python读yaml的库_Python读取YAML文件过程详解
  9. 内推熟人来自己公司一定要慎重
  10. [ubuntu 16.04]如何在新建的Anaconda环境中打开jupyter notebook
  11. extern “C”的含义
  12. 如何识别一个字符串是否Json格式
  13. Minitab 控制图
  14. C#实现的简单的随机抽号器
  15. 人才管理是什么意思_人力资源的HRM、HRD、CHO分别是什么意思?
  16. emmx文件用什么软件打开电脑_我告诉你emmx文件怎么打开
  17. 查询递归表SQL,分类表查询,递归表数据结构转平级查询优化SQL
  18. 程序员如何动手打造属于自己的智能家居
  19. java卡牌游戏详解
  20. ue4树叶飘落动画_Android:使用属性动画制作器的类似于树叶的动画

热门文章

  1. 计算机控制教师端,摆脱学校机房教师端控制的方法汇总
  2. 2020 Java 全栈工程师进阶路线图,不可错过
  3. SDJZU-墓碑上的文字
  4. 关于小学计算机论文题目,经典小学计算机课论文选题 小学计算机课论文题目怎样定...
  5. 立体几何相关公式推导理解(球体、台体体积)
  6. DA14580蓝牙硬件系统总览(二)
  7. go语言 mysql时间对比_go时间比较 - Go语言中文网 - Golang中文社区
  8. Mac系统制作win10启动U盘踩坑实操
  9. 错误: 此上下文中不允许函数定义。
  10. 9个实用的,可以写进简历的数据分析项目!