量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。

核心观点

在控制了市场溢价、规模因素、盈利能力等因素后,无论lead股票和follower股票之间的业务关系如何,他们之间的收益都具有较强的共振效应。新闻共现图的月度degree是一个很好的预测股票横截面收益的指标。一个月的再平衡投资组合测试表明,degree提供了显著的正Alpha(相对Fama-French三因子和五因子模型)。

新闻报道中往往会出现多只股票,这些股票间的收益是否存在关联性?是否能够构建基于新闻中共现股票的有效因子?今天给大家分享的这篇论文,基于美股标普500的近100万篇新闻,详细回答了这个问题。

首先,作者基于股票在新闻中提及的位置,将出现在标题中的股票定义为lead,同时将出现在新闻正文中的其他股票定义为follower。例如下面这篇新闻,Apple出现在新闻标题中,则Apple为leader;Intel、Nike及Peloton出现在正文中,它们就是follower。

定义股票共现图

统计过去 时间段所有新闻 中出现的股票,定义 为股票j出现在标题且股票i出现在正文中的频次。

根据以上 的定义,可以定义以各股票为节点的有向图(Directed Graph),其中边的权重 如下定义:

其中 表示股票i,j在T时间段成对出现(即 )的次数, 。如上定义, 就是股票共现图的邻接矩阵。

我们可以根据股票ij的某些性质来拆解邻接矩阵 (或者说是重构股票共现图)。比如我们可以根据股票i,j是否属于同一行业, 拆解成 (同属一个行业的股票的邻接矩阵)和 (不属于同一行业股票的邻接矩阵):

同样,也可以根据lead股票是不是大盘股,将 拆解为 (lead股票市值为前30%的股票构成的邻接矩阵)和 (lead股票市值为后70%的股票构成的邻接矩阵):

最后,我们也可以根据股票的流动性(使用换手率指标),将 拆解为 (lead股票换手率为前30%的股票构成的邻接矩阵)和 (lead股票换手率为后70%的股票构成的邻接矩阵):

使用不同的维度将 进行拆解(相当于把共现图进行过滤),我们能够研究不同属性的股票收益率之间关联性。比如将邻接矩阵根据行业拆解后,我们能够对比是同一行业的股票的收益共振更强烈,还是不同行业的股票的收益共振更强烈。

定义领先收益(Lead Return)

如上文所述,我们将每篇新闻中出现的股票分为lead股票和follower股票。一个自然而然的问题,follower股票的收益是否会受到lead的影响?由于每个follower有多个lead,所以我们首先需要定义领先收益(lead return):

即每个follower在t时间的lead return,为这个follower股票i所有lead股票j在t时间的加权收益,加权的权重为邻接矩阵的元素 。这里在确定共现图时,使用的是滚动窗口 (即时间t-l至t)的所有新闻。我们也可以根据lead股票的收益的正负,单独计算正(负)lead return:

共现股票收益关联性研究

本文使用以下多元面板回归,研究lead股票与follow股票收益的关联性。当h等于0时,研究的是lead股票与follow股票收益的co-movement;当h大于0时,研究的是lead股票收益对follow股票收益的领先性(预测性)。在后续的实证分析中,用做因变量的follow股票收益数 y ,除了使用原始收益外,还使用了去除Fama-Frech三因子和五因子收益的残差收益。

在实证分析中,作者从50多个网站2016-2020年期间共100多万篇新闻,构建了标普500成分股的新闻共现关系图,使用的滑动窗口为1年。如下图为AAPL和其lead股票收益的关系。可以发现,AAPL和它的lead股票收益存在明显的co-movement;而且如中间子图所示,与同行业的股票co-movement更显著。

基于所有标普500成分股,按以上等式面板回归的结果如下表所示,我们有以下发现:

  • 在去除其他风格因子影响后,follower股票与lead股票之间存在显著的co-movement;

  • follower股票与同行业lead股票的co-movement更加显著,但与不同行业lead股票的co-movement也很显著;

  • 相对市值小的lead股票的co-movement,follower股票与市值更大的lead股票的co-movement更显著。

  • 相对流动性大的lead股票的co-movement,follower股票与流动性小的lead股票的co-movement更显著。

当我们将h设为1时,我们研究了前一天lead股票的收益相对于当天follower股票的预测性,结果如下表所示,我们可以看出:

  • 整体上(如第1列所示),lead股票对于follower股票的收益没有预测性;

  • 非同一行业lead股票收益有明显的反转效应(即前一天它们收益越低,follower股票收益越高);

  • 正lead return的股票有明显的动量效应(即前一天它们收益越高,follower股票收益越高);

根据以上测试结果,我们可以将具有有效预测作用的lead return进行加总,构建以下因子,分组测试结果如下表所示:

除了使用lead return构建因子,我们还可以使用图本身的特征构建因子,比如使用图的degree。下图表展示了使用过去1个月的新闻数据构建共现图,然后使用图节点的degree作为因子的分组测试结果(月度调仓):

综上,我们可以发现,lead return和degree因子的分组测试都有显著的单调性,但考虑交易成本后,degree因子的有效性更加显著。

总结

我们发现,在控制了市场溢价、规模因素、盈利能力等因素后,无论lead股票和follower股票之间的业务关系如何,他们之间的收益都具有较强的共振效应。新闻共现图的月度degree是一个很好的预测股票横截面收益的指标。一个月换仓的投资组合测试表明,degree提供了显著的正Alpha(相对Fama-French三因子和五因子模型)。

我们的结果为投资组合管理提供了两个见解。首先,投资者可以通过考虑资产之间的共振效应来优化他们的投资组合。其次,基于degree的投资组合检验可以很容易地转化为交易策略。

Lead-follower因子:新闻共现股票收益的关联性研究相关推荐

  1. 【机器学习】基于A股新闻共现网络的股票收益分析

    核心观点 ▪ 本文利用新闻数据,以全量公司(上市+非上市)为节点,以共同出现在新闻中为边,构建了新闻共现网络,并对其做社群检测: ▪ 新闻共现网络内,有关联的股票对比无关联股票对表现出更强的相关性:社 ...

  2. A股实践 :图神经网络与新闻共现矩阵策略(附代码)

    量化投资与机器学习微信公众号,是业内垂直于量化投资.对冲基金.Fintech.人工智能.大数据等领域的主流自媒体.公众号拥有来自公募.私募.券商.期货.银行.保险.高校等行业30W+关注者,荣获202 ...

  3. 基于熵测度的股票收益非对称性因子研究

    1. 在市场上行和下行时,股票收益常常会表现出与市场同涨或同跌的现象. 同一只股票对市场上涨和下跌的敏感性可能是不同的,这表明股票收益在与市场收益发生联动变化的过程中会展现出非对称性.这样的非对称性可 ...

  4. 复现东方证券研报--投机、交易行为与股票收益

    本篇复现的研报与复现东方证券研报--特质波动率因子研究为同一系列,在上一篇的基础上进行的深入研究. 结论概述 由于市场体制.投资者结构.投资者教育等多方面的原因 A 股市场投机性较强,既然不能改变 A ...

  5. 基于 python获取教育新闻进行分词关键词词共现分析 知识图谱 (附代码+报告)

    本文着眼于对疫情期间教育领域新闻的分析,基于 python 语言,利用爬虫获取教育领域的最新新闻,并将其内容进行分词,抓取关键词.在此基础上,根据关键词进行共现分析,并利用 Gephi 软件绘制主题知 ...

  6. 基于A股供应链网络的股票收益分析

    量化投资与机器学习微信公众号,是业内垂直于量化投资.对冲基金.Fintech.人工智能.大数据等领域的主流自媒体.公众号拥有来自公募.私募.券商.期货.银行.保险.高校等行业30W+关注者,曾荣获AM ...

  7. 练习题︱基于今日头条开源数据的词共现、新热词发现、短语发现

    最近笔者在做文本挖掘项目时候,写了一些小算法,不过写的比较重,没有进行效率优化,针对大数据集不是特别好用,不过在小数据集.不在意性能的情况下还是可以用用的. 本次练习题中可以实现的功能大致有三个: 短 ...

  8. 机器学习预测股票收益(一)之随机森林模型

    机器学习预测股票收益(一)之随机森林模型 前言 一.导入库和数据 二.处理数据以及计算特征变量 三.使用随机森林回归预测股票收益 1.构建训练集和测试集 2.查看预测结果 四.根据预测结果构建long ...

  9. 【Python金融量化 9- 100 】九、预测股票收益方法总结

    背景介绍: 量化投资有两大主流门派:主动投资和被动投资.这也代表了不同的学术观点:市场到底是不是有效的? 如果市场是有效的,那我们一定能找到赚钱的办法,只要付诸足够的努力,再加上一点点小小的天赋,我们 ...

最新文章

  1. 通过产品ID得到collection!!!
  2. R语言与数据分析(6)-R包的安装
  3. forever不重启 node_运维监控Prometheus,部署安全的node_exporter监控主机
  4. activiti-explorer 启动报错 Error creating bean with name 'demoDataConfiguration'
  5. 数学建模中常用的方法
  6. 从Oracle到PostgreSQL:Storage Index 特性 vs BRIN 索引
  7. 比特币价格会达到10万美元?有人用蒙特卡罗方法预测了一下
  8. Controller中servletFileUpload.parseRequest(request)解析为空
  9. python中等高线填充颜色_Matplotlib:使用透明颜色填充等高线图
  10. 计算机打表格图,快速填充/微图表/一秒制作打勾方框
  11. Python线图点图--matplotlib.pyplot.plot
  12. 教你如何一键重装Windows7系统
  13. AppInventor简单使用教程
  14. 【游戏介绍】aiwi体感balance
  15. android版 点击下载,暴雪游戏手机安全令Android版下载与使用说明
  16. Mongodb报错:“not authorized on admin to execute command “
  17. Unity虚拟天文馆
  18. Mysql中求两个时间差的小时数以及mysql中substring_index 用法
  19. mysql中discount用法_MySQL 技巧:COALESCE 函数的使用
  20. 自动解析zxw文档的javascript 代码保存

热门文章

  1. 回环口--Loopback接口
  2. 计算机毕设(附源码)JAVA-SSM化妆品销售网站
  3. Maven分模块管理时com.xx.xx.service等找不到
  4. Mysql 统计每周,半个月的数据
  5. 【5】天猫精灵开放平台实验—基于天气查询模板创建开发屏显页面技能
  6. VC++ 中主线程等待子线程结束的方法
  7. 拓嘉启远:定制类的商品如何处理退款
  8. HTML期末作业-电影主题网站介绍
  9. AT指令详解,错误代码详解
  10. python金融量化风险_Python量化:评估投资组合的收益率和风险