这篇文章将会结合理论深度剖析为何选取相关性系数作为评价因子有效性的指标之一,以及结合中国期货市场分析不同情况下的因子相关性的最低要求。

在因子投资策略中,经常会选取某因子或合成因子排名靠前的股票投资,那如何评价因子的有效性呢?一个最常用的评价指标就是IC(information correlation),也就是皮尔逊相关性系数。假设y是因子的取值,x是下一个周期的收益率,那么因子的IC计算公式如下:


其中D(x)表示x的方差。

在查看一些资料中,经常会看到一个因子如果IC值大于0.03,那么这个因子可以称为有效因子,如果IC值大于0.05那么这个因子可以说是非常有效的。当看到这的时候,我之前一直很困惑,虽然对于IC值可以用来评价因子有效性这个很好理解,但是为什么IC值大于0.03就是一个有效因子了呢?这个问题一直困惑了我很久,直到前几天看到了《量化策略开发与可微编程(二):目标函数》这篇文章,彻底打开我心中的疑虑。文章链接:

https://mp.weixin.qq.com/s/cESJKH4bsg0CZxr4XP6JtQ

下文将给出具体的理论推导并结合中国期货市场进行分析。

理论推导

在因子投资策略中,对于不同品种投资的仓位是根据因子值(信号值)来设定的,一些策略会选取排名靠前的进行做多,一些策略选取排名前几和排名后几的进行对冲做多和做空,还有其他很多方式这里不做过多介绍。现在假设仓位分布与因子值成正比,因子的绝对值越大仓位越重,因子值为负数表示做空。则不考虑手续费的情况下,下一周期的收益期望为:


其中表示x为下一周期的收益率,y为仓位,这个仓位与因子值成正相关关系。

一般来说,下一周期的收益率分布与正态分布相似,现在假设下一周期的收益率服从均值为0标准差为sigma_x的正态分布。而对于因子值的分布的话,如果是用一些机器学习挖掘出来的因子,这个因子值通常也能学习到收益率的分布,所以可也以认为是服从均值为0标准差为sigma_x的正态分布;如果因子是其他方式提取出来的话,经过一些方式变换后的分布也会与收益率分布图像相似。因此我们可以给出一个假设:收益率x与仓位y是服从标准差为sigma_x均值为0的正态分布。

下面给出相关性与E(xy)的计算相关推导:



从公式中可以发现,在相关系数一定的情况下,在一定范围内,D(x) 越小,期望的收益率就会越小(与标准差相关的二次函数)。所这也是为什么高频交易特别需要考虑手续费的原因,因为持仓时间越短收益率的方差越小,这就使得期望收益率越小。

下面分析日频调仓和10分钟调仓的交易下,因子相关性的最低要求。

日频调仓(每日进行一次仓位调整)

下图为期货市场第二天的收益率分布直方图,从图上可以看出这个分布与正态分布还是很像的。


经过计算,收益率的方差为0.0001525,假设单笔交易手续费为0.0001,买入卖出手续费为0.0002,因此有D(x) = 0.0001525,C=0.0002。所以rho(相关性系数)大概在大于等于0.016的情况下,期望是正的。当然实际情况肯定比这复杂,除此之外为了追求低回撤,这个相关性肯定要更高。

10分钟调仓(每10分钟进行一次仓位调整)

下图为期货市场10分钟后收益率分布直方图,从图上可以看出这个分布也与正态分布很像。

通过统计可得D(x) = 0.0000062131,C=0.0002。所以rho(相关性系数)大概大于等于0.064的情况下,期望是正的,当然实际情况肯定也比这复杂。

总结

这篇文章结合理论与实验分析了不同情况下因子相关性与期望收益率之间的关系。文中的理论部分加了很多假设,其给出最低的因子相关性也是基于这些假设的。因为实际情况很复杂,所以实际要求的相关性往往会比本文给出最低的相关性数值还高。除此之外,不同策略对相关性的要求也是不同的。

通常情况下相关性越高的因子越好,但相关性有时也会误导策略研究员,具体文章可以看石博士的《用 IC 评价因子效果靠谱吗?》,文章链接:

https://zhuanlan.zhihu.com/p/41454197

对量化、数据挖掘、深度学习感兴趣的可以关注公众号,本人不定期分享有关这些方面的研究。

个人知乎:
https://www.zhihu.com/people/e-zhe-shi-wo/activities

深度剖析为何选取相关性系数评价因子相关推荐

  1. 深度剖析目标检测算法YOLOV4

    深度剖析目标检测算法YOLOV4 目录 简述 yolo 的发展历程 介绍 yolov3 算法原理 介绍 yolov4 算法原理(相比于 yolov3,有哪些改进点) YOLOV4 源代码日志解读 yo ...

  2. 如何理解相关性系数(pearson、spearman、kendall)

    转载: https://www.jianshu.com/p/7697eb89926a 三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度 ...

  3. 相关性系数及其python实现

    参考文献: 1.python 皮尔森相关系数 https://www.cnblogs.com/lxnz/p/7098954.html 2.统计学之三大相关性系数(pearson.spearman.ke ...

  4. 统计学三大相关性系数:pearson,spearman,kendall

    目录 person correlation coefficient(皮尔森相关性系数-r) spearman correlation coefficient(斯皮尔曼相关性系数-p) kendall ...

  5. 统计学之三大相关性系数简介(pearson、spearman、kendall)

    三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表 ...

  6. 最强神作!Crysis深度剖析与优化指南

    题目:最强神作!Crysis深度剖析与优化指南 作者:小熊在线--WolStame 介绍:最强游戏Crysis全方位剖析与深度优化指南 关键:CRYSIS/DX10游戏/技术剖析/优化 原创:小熊在线 ...

  7. 《AngularJS深度剖析与最佳实践》一2.13 端到端测试

    本节书摘来自华章出版社<AngularJS深度剖析与最佳实践>一书中的第2章,第2.13节,作者 雪狼 破狼 彭洪伟,更多章节内容可以访问云栖社区"华章计算机"公众号查 ...

  8. 深度剖析 | SN 可微分学习的自适配归一化 (Switchable Normalization)

    补充:NIPS 2018 | MIT新研究参透批归一化原理 根据最新的研究,BN层的成功和协方差什么的没有关联!证明这种层输入分布稳定性与 BatchNorm 的成功几乎没有关系.相反,我们发现 Ba ...

  9. 深度剖析ConcurrentHashMap

    在阅读Spring IOC源码的时候,发现了里面的map是ConcurrentHashMap.有些疑问,我们平时都使用HashMap和HashTable,我们也知道,HashMap是线程不安全的,但是 ...

最新文章

  1. 一堂拯救千万股民的公开课,不能错过!
  2. 调试小技巧---利用调用堆栈
  3. 深度解析 H.265 视频解决方案
  4. TIOBE 2011年7月编程语言排行榜:Objective-C成为年度语言
  5. Hadoop HDFS概念学习系列之shell命令使用HDFS的一些其他命令(十九)
  6. 三国志9加强版孙权情之章攻略-赤壁之战
  7. 推荐系统经典论文学习
  8. 【HTML】中国天气天气插件调用
  9. Android开发笔记(三十二)文件基础操作
  10. Linux下C++开发系列(一)序——我是如何开始linux下C++开发的
  11. Java web 实战项目案例
  12. Cadence Allegro PCB设计88问解析(四) 之 Allegro中快捷键Funckey与alias设置
  13. 如何在EXCEL中画横线并输入汉字
  14. pacemaker+corosync+pcs实验
  15. 如何判断是否受到DDOS攻击?被攻击该如何解决?
  16. unity3d中animator和animation k动画注意点和问题 无法播放等等
  17. LinkedIn learning (旧Lynda)国外图书馆账号申请
  18. ui和平面设计的区别?ui设计做什么的?
  19. php 国密,PHP实现国密算法SM4
  20. 艾默生lng流量计安装注意事项

热门文章

  1. 学生宿舍管理系统c语言程序设计,学生宿舍管理系统C语言编程.doc
  2. 怎样用python制表_用Python绘图和制表(附泰坦尼克号案例)
  3. 玩转场景化推送,精准把握受众
  4. 2018深信服笔试-抓兔子 DP
  5. 很多人说单片机很简单。但本专业学生都认为单片机是最难学的课程。为什么学起来都这么吃力呢?
  6. 【钉钉-场景化能力包】IoT物联网设备协同
  7. 谷歌、甲骨文史诗级版权诉讼案,10 年 API 之争本周开审
  8. 为何学习Python?这是我看到的最好回答
  9. 总浮动时间(TF) 自由浮动时间(FF) 区别
  10. 诺威健康IPO招股书失效:称将继续录得巨额亏损,TPG持股74.6%