时序分析 27 时序预测

格兰杰因果关系(上) 理论知识

本文主要阐述Granger Causality,即格兰杰因果关系在时间序列预测中的应用。

背景与回顾

本系列前面的文章中,我们讨论过了时序分析预测的多种方法,包括单变量时序问题和多变量时序问题。我们也讨论过了时序的分解:趋势、周期和随机噪声。预测时序在未来某个时间点的值是时序预测问题的常见问题,时序预测问题经常会使用机器学习方法,在金融、天气预报、医疗、商务和零售等领域都有很多应用。

在实际问题中,时序预测问题通常涉及多个变量,而各个变量之间经常存在依赖关系。这种依赖关系经常会对预测结果产生严重的影响,尤其是业界常用的多元回归方法,人们通常会被误导,结果的决定性系数很高,但实际上所训练的模型是非常不可靠的。为了进一步理解这种误导所带来的问题,让我们看一个例子:

线性回归通常会揭示变量之间的线性关系,但很可能实际上这种关系根本不存在。领域知识会告诉我们预测模型完全无用,这种现象称为伪回归。请见下图:

从上图中可以看到,鸡肉的消费量和原油的出口呈现很强的相关性,但这是完全不符合逻辑的。

伪回归中经常会呈现明显的趋势、非平稳时序和较高的决定性系数。我们需要在构建模型时消除伪回归,因为所得出的结果既没有相关性也不具备因果性。可能有的读者会说,在构建多元回归模型时需要观察变量之间的相关矩阵,如果出现两个自变量之间的相关系数较高,那么会留下一个变量而剔除另外一个以达到消除自变量之间的依赖关系。但是这种方式并不能完全解决这个问题,因为如果时序数据中的时间是一个干扰因素(confounding factor)或者潜在变量(lurking variable),那么前面所说的计算的相关系数很可能存在时间区间限制问题,换句话说就是它只是测量了两个自变量之间的关系而已,并没有充分考虑它们与时间的关系。为了清晰解释这个问题,请看下面维基百科上的图:

上图中,时序X对时序Y显然有很直接的影响,但是它们大概差了5个时间点。这种情况下,相关系数失效。

格兰杰因果关系(Granger Causality)

注:本文中会提到一些时序分析的基本概念,读者可自行查阅其他文档或参见本人时序分析其他系列文章。

格兰杰因为发展了因果概念来提高经济学上的时序预测的效果而在2003年获得了诺贝尔经济学奖,但这个因果概念依然不是人类逻辑学上的因果关系,而是预测上的因果关系(predictive causality),所以才会被称为格兰杰因果关系。

我们首先从直观上理解一下:如果一个时序变量X是另外一个时序变量Y的格兰杰因(Granger-Causes, 又称为G-Causes),那么说明利用Y过去的信息和X过去的信息来预测Y的效果要好于只使用Y过去的信息。也就是说,X现在和过去的信息包含了关于Y的某种信息。
格兰杰因果关系有两个原则:

  • 原因(X)发生在效果(Y)之前
  • 原因(X)包含有关效果(Y)的未来的独特信息

我们给出格兰杰因果关系的数学定义:
如果有一下两个自回归建模的时序变量,
X1(t)=∑j=1pA11,jX1(t−j)+∑j=1pA12,jX2(t−j)+E1(t)X_1(t) = \sum_{j=1}^p{A_{11,j}X_1(t-j)} + \sum_{j=1}^p{A_{12,j}X_2(t-j)+E_1(t)} X1​(t)=j=1∑p​A11,j​X1​(t−j)+j=1∑p​A12,j​X2​(t−j)+E1​(t)
X2(t)=∑j=1pA21,jX1(t−j)+∑j=1pA22,jX2(t−j)+E2(t)(1)\tag{1}X_2(t) = \sum_{j=1}^p{A_{21,j}X_1(t-j)} + \sum_{j=1}^p{A_{22,j}X_2(t-j)+E_2(t)}X2​(t)=j=1∑p​A21,j​X1​(t−j)+j=1∑p​A22,j​X2​(t−j)+E2​(t)(1)
上式中,

时序分析 27 - 时序预测 格兰杰因果关系(上) 理论知识相关推荐

  1. 时序分析 26 - 时序预测 Prophet包初探

    时序分析 26 时序预测 - Prophet包初探 前言 在本系列前面的文章中,我们介绍了多种时序预测技术和模型.我们可以看出时序预测技术还是非常复杂的,步骤也比较繁琐.读者可能还记得VAR模型的步骤 ...

  2. 时序预测的三种方式:统计学模型、机器学习、循环神经网络

    作者 | luanhz 来源 | 小数志 导读 时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用.甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格.天气变化等等.关于 ...

  3. 时序分析 44 -- 时序数据转为空间数据 (三) 格拉姆角场 python 实践 (上)

    格拉姆角场 python实践 时序预测问题是一个古老的问题了,在笔者关于时序分析的系列中已经介绍了多种时序预测分析技术和方法.本篇我们将使用一种新的思路来进行时序预测:对金融数据进行GAF(格拉姆角场 ...

  4. R语言机器学习 格兰杰因果关系检验(Granger cointegratance)

    经济学家开拓了一种试图分析变量之间的格兰杰因果关系的办法,即格兰杰因果关系检验.该检验方法为2003年诺贝尔经济学奖得主克莱夫·格兰杰(Clive W. J. Granger)所开创,用于分析经济变量 ...

  5. 格兰杰因果关系检验_混频(mixed frequency)数据的格兰杰因果(Grange causality)检验及其Matlab实现...

    格兰杰和格兰杰因果 网络搜到的Grange大神标准照 格兰杰1934年9月出生于英国威尔士的斯旺西,早期就读于诺丁汉大学,接受当时英国第一个经济学数学双学位教育,1955年留校任教,1957年在天文学 ...

  6. 计量经济学之格兰杰因果关系检验(Granger causality test)

    Granger causality test 格兰杰检验是干什么的?--分析变量之间是否存在因果关系 格兰杰检验的前提条件?--时间序列平稳 格兰杰检验不成立的意义--不表示X和Y之间无因果关系 格兰 ...

  7. 【计量经济学导论】12. 格兰杰因果关系检验

    文章目录 格兰杰因果关系检验 时间序列向量自回归模型 向量自回归模型设定 VAR{\rm VAR}VAR 模型的估计 格兰杰因果关系检验 格兰杰因果关系检验的实际问题 格兰杰因果关系检验 时间序列向量 ...

  8. 格兰杰因果关系检验(Granger Causality Test)

    一.初识 不禁感慨,科研搞到最后,多学科交叉融合才是王道啊!格兰杰因果检验由 2003 年诺贝尔经济学奖得主 Clive W. J. Granger 开创,用于分析经济变量之间的因果关系(但非逻辑上的 ...

  9. 时序预测:从两篇高影响力的论文谈起

    未来可以预测吗? 本文从两篇高影响力的时序预测文章谈起,其中一篇是18年放在arXiv上的文章,文中总结性地提出了时序卷积网络(TCN: Temporal Convolutional Network) ...

  10. 用于金融时序预测的神经网络:可改善经典的移动平均线策略

    北京 上海巡回站 | NVIDIA DLI深度学习培训 2018年1月26/1月12日 NVIDIA 深度学习学院 带你快速进入火热的DL领域 阅读全文                        ...

最新文章

  1. 2022-2028年中国汽车橡胶密封件行业市场深度分析及发展趋势分析报告
  2. 1027. 戴绿帽子的空管
  3. 在建工程直接费用化_计入在建工程的成本怎么算
  4. 将shp文件导入到GeoDatabase中
  5. 在线实时大数据平台Storm集成redis开发(分布锁)
  6. Linux一键部署duckchat,宝塔面板部署DuckChat(翻译:鸭信)- 一个简约好用的网络聊天平台...
  7. 痛与快乐有一个代码是什么_养一只真大型犬的生活是什么样的?铲屎官:痛并快乐着!...
  8. 正则表达式的一点说明
  9. 博阅likebook alita专用pdf制作
  10. python3ubunton安装视频_ubuntu16.04安装python3的包报错
  11. python 自定义词典_cawdrey-Python的几个有用的自定义词典 -Dominic Davis-Foster
  12. 如何更好使用 ng-zorro-antd 图标
  13. Android如何进行反编译
  14. 生活记录:给枯燥的心灵浇浇水
  15. 编程语言的宗教狂热和十字军东征
  16. 抓取全网财经新闻,计算新闻相关股票的多空舆情,量化买入
  17. MongoDB数据库的安装及使用教程
  18. win32下进程间通信——共享内存
  19. 基于单片机红外对管测风速控制系统设计(毕设课设)
  20. echarts修改横轴/xAxis的样式

热门文章

  1. 解决com.lowagie.text.DocumentException: Font 'STSong-Light' with 'UniGB-UCS2-H' is not recognized.
  2. Spring AOP术语:连接点和切点的区别。
  3. 短消息类新旧服务代码对应表
  4. 2022-2028全球与中国卡个性化设备市场现状及未来发展趋势
  5. 电脑重装系统蓝屏是什么原因
  6. 基于transformor的拼音转汉字语言模型。
  7. 火热的区块链技术,也能解决文化领域的这些痛点
  8. pycharm条件判断
  9. 密码攻防系列文章27-web后台登录口令暴力破解及防御
  10. 如何通俗易懂地理解递归