比较横截面与时间序列的因子模型
发表于2020年Review of Financial Studies上的"Comparing cross-section and time-series factor models"一文,作者是2013年诺贝尔经济学奖得主、芝加哥大学Booth商学院的Eugene F. Fama,和他的老搭档、达特茅斯学院Amos Tuck商学院的Kenneth R. French,这也是二位的最新一次合作。
该文十分简单,且为纯实证,本文对其关键部分作个剖析。
在下文中,用CS(Cross-Section)表示“横截面”一词,用TS(Time-Series)表示“时间序列”一词。
1 实证模型
在因子模型中,资产的收益率应由资产在因子上的载荷,乘上因子收益率构成。有了因子收益率,就可以回归得到因子载荷,而有了载荷,也可以回归得到因子收益率,到底应该用哪种方式呢?该文共比较了4种模型。
第一个模型,使用Fama和MacBeth(1973)的CS回归方法,直接用公司特征作为载荷,用CS回归,得到的系数就是因子收益率:
Rit=Rzt+RMCtMCit−1+RBMtBMit−1+ROPtOPit−1+RINVtINVit−1+eit(1)\begin{aligned} R_{it}=&R_{zt}+R_{MCt}MC_{it-1}+R_{BMt}BM_{it-1}\\ &+R_{OPt}OP_{it-1}+R_{INVt}INV_{it-1}+e_{it} \tag{1} \end{aligned} Rit=Rzt+RMCtMCit−1+RBMtBMit−1+ROPtOPit−1+RINVtINVit−1+eit(1)
这样得出的因子,称为CS因子。
然后,将截距项移到左边,将自变量与系数交换位置,就成了一个资产定价模型:
Rit−Rzt=MCit−1RMCt+BMit−1RBMt+OPit−1ROPt+INVit−1RINVt+eit(2)\begin{aligned} R_{it}-R_{zt}=&MC_{it-1}R_{MCt}+BM_{it-1}R_{BMt}\\ &+OP_{it-1}R_{OPt}+INV_{it-1}R_{INVt}+e_{it} \tag{2} \end{aligned} Rit−Rzt=MCit−1RMCt+BMit−1RBMt+OPit−1ROPt+INVit−1RINVt+eit(2)
第二个模型,就是先通过Fama和French(2015)中构造的TS因子的方法,即用多空组合的方式,构造出因子的收益率序列,然后,再以TS因子收益率为自变量,进行TS回归,得到的系数就是载荷:
Rit−Rft=ai+bi(Rmt−Rft)+siSMBt+hiHMLt+riRMWt+ciCMAt+eit(3)\begin{aligned} R_{it}-R_{ft}=&a_i+b_i(R_{mt}-R_{ft})+s_i {SMB}_t+ h_i HML_t \\ &+r_i RMW_t + c_i CMA_t+e_{it} \tag{3} \end{aligned} Rit−Rft=ai+bi(Rmt−Rft)+siSMBt+hiHMLt+riRMWt+ciCMAt+eit(3)
第三个模型,用(1)中得出的CS因子,替换(3)中的TS因子,同样进行TS回归,得到载荷:
Rt−Rft=ai+b1i(Rmt−Rft)+b2iRMCt+b3iRBMt+b4iROPt+b5iRINVt+eit(4)\begin{aligned} R_t-R_{ft}=&a_i+b_{1i}(R_{mt}-R_{ft})+b_{2i} R_{MCt}+ b_{3i} R_{BMt}\\ &+b_{4i} R_{OPt} + b_{5i} R_{INVt} +e_{it} \tag{4} \end{aligned} Rt−Rft=ai+b1i(Rmt−Rft)+b2iRMCt+b3iRBMt+b4iROPt+b5iRINVt+eit(4)
(3)与(4)得到的载荷都不是时变的,为了引入时变载荷,可以在系数中加入时变的CS因子,即加入交叉项:
Rit−Rft=ai+bi(Rmt−Rft)+siSMBt+hiHMLt+riRMWt+ciCMAt+si2MCit−1SMBt+hi2BMit−1HMLt+ri2OPit−1RMWt+ci2INVit−1CMAt+eit(5)\begin{aligned} R_{it}-R_{ft}=&a_i+b_i(R_{mt}-R_{ft})+s_i {SMB}_t+ h_i HML_t \\ &+r_i RMW_t + c_i CMA_t\\ &+s_{i2}MC_{it-1}{SMB}_t+h_{i2}BM_{it-1}HML_t\\ &+r_{i2}OP_{it-1} RMW_t + c_{i2} INV_{it-1} CMA_t+e_{it} \tag{5} \end{aligned} Rit−Rft=ai+bi(Rmt−Rft)+siSMBt+hiHMLt+riRMWt+ciCMAt+si2MCit−1SMBt+hi2BMit−1HMLt+ri2OPit−1RMWt+ci2INVit−1CMAt+eit(5)
(2)(3)(4)(5)组成了要检验的4个模型。
2 数据
2.1 因子构建
对于FF(2015)的五因子模型即方程(3),在每个6月底生成一次规模SMB、价值HML、盈利RMW、投资CMA的TS因子。
HML(High Minus Low)因子:用NYSE的6月底的中位数MC(市值)作为断点,将NYSE、AMEX、NASDQA的所有股票分入高/低市值组;再独立地用NYSE股票的BM的30th30^{th}30th和70th70^{th}70th分位数作为断点,分成3组。TTT年6月的BM,就是T−1T-1T−1年财年末的账面净值与T−1T-1T−1年12月底市值(在12月到财年末,若在外发行股票数可能有变化,则需要调整)的比率,再取对数。这样就可以得到2×32\times 32×3个市值加权(VW,value-weight)组合。HML是大市值分组中的高低BM组合收益率之差,与小市值分组中的高低BM组合收益率之差,取平均数。
RMW(Robust Minus Weak)、CMA(Conservative Minus Aggressive)因子:做法与HML类似,生成RMW时用OP(Operating profitbality),生成CMA时用INV(Investment)。
SMB(Small Minus Big)因子:前面一共得到3个2×32\times 32×3组合,用其中的9个小市值组合的平均收益率减去剩下的9个大市值组合的平均收益率,即为SMB因子。
UMD(Up Minus Down)因子:先用从t−12t-12t−12月到t−2t-2t−2月的累计收益率除以11,作为MOM,再用MOM作为第二个因子构造2×32\times 32×3组合,得到UMD因子,它是月度更新的。
MC、BM、OP、INV、MOM等公司特征:就是构造以上因子所用到的公司特征。个股的BM、OP、INV在每年6月更新,MC和MOM在每个月更新。组合的特征就是组合中股票的VW平均值,权重(市值)每个月更新。
构造CS因子,每个月进行(1)式回归,对每个RHS的公司特征做z-score处理,在不加入MOM时用18个组合做标准化,在加入MOM时用24个组合做标准化。在做标准化之后,CS水平收益率RztR_{zt}Rzt就是18或24个LHS资产收益率的等权重均值。
构建因子的LHS资产:为使CS和TS因子可比,月度回归(1)式的左侧资产选择18个生成了SMB、HML、RMW、CMA的VW组合。如果模型中要用到CS动量因子,也加入生成UMD的6个VW组合。
2.2 描述性统计
表1为上述因子的描述性统计,Panel A为TS因子,Panel B为CS因子。样本区间为1963.7–2018.8,共662个月度收益率。
我们知道OLS回归得到的系数为β^=(X′X)−1X′y\hat{\beta} = (X'X)^{-1}X'yβ^=(X′X)−1X′y,也就是yyy的线性组合。那么(1)式中系数就是RztR_{zt}Rzt和CS因子的收益率,也就是说,它们其实是由LHS资产的收益率线性组合出来的。那么,组成它们的,不同的LHS资产的权重是多少呢?表2列出了结果。
2.3 用于测试的LHS资产
在实证中,用于检验的LHS资产使用每年6月更新的MC和BM、OP、INV的333组5×55\times 55×5组合,再加上月度更新的MC和MOM的5×55\times 55×5组合。注意,用于生成因子的LHS资产还是以前的2×32\times 32×3组合,但用于检验的是5×55\times 55×5组合。
为增加一些挑战性,再在LHS中加入FF(2016)的异象组合:
- 长期困扰CAPM的单变量市场beta与平均收益率的扁平关系(flat relation);
- 股票回购后的高平均收益率,与股票发行后的低平均收益率;
- 应计利润大的公司,平均收益率较低;
- 日收益率方差大的公司,平均收益率较低。
同样使用MC和这些异象变量的NYSE的5分位数,构造5×55\times 55×5组合。但这里有几个例外:一是股票净发行(NI,Net share Issue)需要用7分位数,即净回购、无回购无发行,以及净发行的5分位数;二是大市值股票中几乎没有高收益率波动的,因此不适合使用独立双重排序,只能在MC排序后的基础上再进行排序。
MC-VAR组合是月度更新的,而其他异象组合都在每年6月底更新。
3 模型比较标准
该文用了多种模型比较标准。在这里用AAA和VVV表示横截面的均值方差,aaa表示模型产生的截距向量,比较标准有:
- A∣a∣A|a|A∣a∣:截距项绝对值的均值;
- A∣t(a)∣A|t(a)|A∣t(a)∣:截距项的ttt值的绝对值的均值;
- Aa2Vrˉ\dfrac{A a^2}{V \bar r}VrˉAa2:和下面一个一样,都是度量截面的分散程度,分子为截距平方的均值,Vrˉ{V \bar r}Vrˉ为LHS资产的平均收益率的截面方差;
- Aλ2Vrˉ\dfrac{A \lambda^2}{V \bar r}VrˉAλ2:修正截距的平方为λ2≡a2−s2(a)\lambda^2 \equiv a^2-s^2(a)λ2≡a2−s2(a),这是因为在估计截距时有噪声;
- AR2AR^2AR2:回归R2R^2R2的均值;
- As(a)As(a)As(a):截距标准误的均值;
- As(e)As(e)As(e):残差标准差的均值;
- Sh2(a)Sh^2(a)Sh2(a):截距的最大平方夏普比率,用Σ\SigmaΣ表示回归残差的协方差矩阵,则Sh2(a)=a′ΣaSh^2(a)=a'\Sigma aSh2(a)=a′Σa;
- GRSGRSGRS:GRS统计量;
- p(GRS)p(GRS)p(GRS):GRS统计量的p值;
- T2T^2T2:Hotelling’s T2T^2T2;
- p(T2)p(T^2)p(T2):Hotelling’s T2T^2T2的ppp值。
4 实证结果
4.1 总体结果
实证结果在表3中,其中Panel A1和Panel A2检验了模型(3)、(4),Panel A3、Panel A4检验了模型(5)。
在检验模型(3)、(4)、(5)时,都是用TS回归,然后将各资产回归得到的截距项放在一起,形成向量aaa。但由于模型(2)是从CS回归中变化而来,可以不再做TS回归。Panel B1和Panel B2是使用CS因子对测试LHS资产相对RztR_{zt}Rzt的超额收益率做回归的情况,而Panel B3–B6则不再做TS回归。
在Panel B5和Panel B6中,模型(2)中的RzR_zRz和CS因子是用(1)式由不同2×32\times 32×3组合生成的,接着,用每个LHS测试资产的公司特征做加权平均,用生成CS因子时的18个或24个组合的均值和标准差对它做标准化,最后的值作为LHS测试资产的因子载荷,再乘上事先得到的CS因子的收益率,去预测LHS测试资产的相对RztR_{zt}Rzt的超额收益率,从而得到每个LHS资产在每个月的预测误差。在Panel B3和Panel B4中,用特征的时间序列均值作为CS因子的载荷。在这4个Panel中,载荷不是被估计出来的,因此GRS检验不适用,只能用Hotelling’s T2T^2T2检验。
在每一个评价标准上,Panel B5、B6的结果都比Panel A好。
4.2 去除异象组合后的结果
表4就是在表3的LHS测试资产中剔除了异象组合后的结果,它使用的LHS资产是4组5×55\times 55×5组合,即MC-BM、MC-OP、MC-INV、MC-MOM组合。
在原文的附录中,表A1-A4报告了每个5×55\times 55×5组合的结果。
4.3 在异象组合中的结果
表5是只在110个异象组合中的结果。
在原文的附录中,表A5-A8报告了每种异象组合的结果。
可以看到,不管用什么作为LHS测试资产,模型(2)结果都是最好的,结论稳健。
参考文献
- Fama, E. F., and K. R. French. 2015. A five-factor asset pricing model. Journal of Financial Economics.
- Fama, E. F., and K. R. French. 2020. Comparing Cross-Section and Time-Series Factor Models. Review of Financial Studies.
- Fama, E. F., and J. D. MacBeth. 1973. Risk, return, and equilibrium: empirical tests. Journal of Political Economy.
比较横截面与时间序列的因子模型相关推荐
- 横截面数据、时间序列数据、面板数据
面板数据(Panel Data)是将"截面数据"和"时间序列数据"综合起来的一种数据类型.具有"横截面"和"时间序列"两 ...
- 资产定价模型的截面与时间序列测试
引言 通常,资产定价模型有两种检验方式,一种是Fama和MacBeth(1973)的横截面回归方法,一种是以Gibbons.Ross和Shanken(1989)的GRS检验为中心的时间序列回归方法.本 ...
- 【Python计量】独立混合横截面数据与邹氏检验
文章目录 一.获取数据 二.分组回归 三.联合显著性F检验 四.邹氏检验 五.全套代码 六.拓展 独立混合横截面数据:在不同时点,从一个大总体里进行随机抽样. 面板数据:区别于独立混合横截面,面板数据 ...
- On persistence in mutual fund performance 1997翻译
On persistence in mutual fund performance 1997 ABSTRACT摘要 Using a sample free of survivor bias, I de ...
- 因子择时的三个标尺:因子量因子离散度与因子挤
转 因子择时的三个标尺:因子动量.因子离散度与因子拥挤度 关于因子择时,思路虽然是多样的但是总结下来无非是两个大方向. 第一个方向是"外生变量方法".在这个方向,我们的核心想法是基 ...
- 因子择时的个标尺:因子动量因子离散度与因子挤
转 因子择时的三个标尺:因子动量.因子离散度与因子拥挤度 关于因子择时,思路虽然是多样的但是总结下来无非是两个大方向. 第一个方向是"外生变量方法".在这个方向,我们的核心想法是基 ...
- r怎么对两组数据统计检验_数据科学中最常用的统计检验是什么
r怎么对两组数据统计检验 Business analytics and data science is a convergence of many fields of expertise. Profe ...
- eviews曲线图怎么做_【干货速递】Eviews:你不可不知的经典问答!
更多精彩内容请关注211统计课堂 计量经济学是分析啥的? 01 计量经济学的主要用途或目的主要有两个方面:1.理论检验.这是计量经济学用途最为主要的和可靠的方面.这也是计量经济学本身的一个主要内容.2 ...
- 0、本专栏的预计更新的内容与更新时间表(2022-05-07更新目录排版)
最近专栏增加了咨询服务,凡是以299元购买专栏的,提供三次免费的咨询服务.咨询服务是提供问题解决方向及解决方法(比如关于backtrader某方面的使用问题,量化投资相关的问题),并不是代写策略及根据 ...
- 计量经济学术语(转载)
计量经济学术语 A 校正R2(Adjusted R-Squared):多元回归分析中拟合优度的量度,在估计误差的方差时对添加的解释变量用一个自由度来调整. 对立假设(Alternative H ...
最新文章
- docker 挂载目录_完美解决:Docker部署SpringBoot项目后图片无法访问和上传,3招搞定!...
- GTK+重拾--08 GTK+中的对话框
- linux 错误 ttyname failed: Inappropriate ioctl for device 解决方法
- 全国信息学奥林匹克联赛 ( NOIP2014) 复赛 模拟题 Day1 长乐一中
- Java Mission Control 5.2终于来了! 欢迎7u40!
- 吴恩达机器学习 Coursera 笔记(二) - 单变量线性回归...
- JavaScript之eval() 函数
- windows server 2008 - 隐藏磁盘分区 (2)
- 计算机英语评价,关于计算机专业英文自我评价
- 企业级应用的前端思考。
- 流行的JavaScript库 ——jQuery
- 写了一百万行代码是什么体验?
- 基于Booth算法的64位浮点乘法器的实现
- Word-去掉标题前面的小黑点
- 梦想家CMS内容管理系统(毕业设计)
- 使用空驱动消除设备管理器里面的未知设备
- [概率论]艾波寧捎信(poisson分布)
- 洛谷 P1867 【Mc生存】经验值
- 对比学习用于推荐系统问题(SSL,S^3-Rec,SGL,DHCN,SEMI,MMCLR)
- 字符串求最长公共子序列(相似度计算)