原文链接:

拓端数据科技 / Welcome to tecdat​tecdat.cn

本说明介绍了具有Student-t改进的GARCH(1,1)模型的贝叶斯估计方法。

介绍

摘要

本说明介绍使用Student-t改进的GARCH(1,1)模型对汇率对数收益进行贝叶斯估计。

自Engle(1982)的开创性论文以来,使用时间序列模型改变波动率的研究一直很活跃。ARCH(自回归条件异方差)和GARCH(广义ARCH)类型模型迅速发展成为80年代预测波动率的经验模型的丰富家族。这些模型是金融计量经济学的广泛传播和必不可少的工具。在Bollerslev(1986)引入的GARCH(p,q)模型中,(金融资产或金融指数)对数收益yt在时间t的条件方差假设用ht表示,它是过去q个对数返回和过去p个条件方差的平方的线性函数。更确切地说:

带有Student-t改进的GARCH(1,1)模型基于Nakatsuma(1998)的工作,由Metropolis-Hastings(MH)算法组成,其中分布是根据平方观测值由辅助ARMA过程构建的。这种方法避免了选择和调整采样算法的耗时且困难的任务,特别是对于非专家而言。该程序用R编写,带有一些用C实现的子例程,以加快仿真过程。该算法的有效性以及计算机代码的正确性已通过Geweke(2004)的方法进行了验证。

模型,先验和MCMC方案

可以通过数据扩充编写具有Student-t改进的GARCH(1,1)模型,用于对数收益率fytg。

我们强调以下事实:在MH算法中仅实现正约束。在仿真过程中没有施加平稳性条件。

为了编写似然函数,我们定义向量y =(y1,...,yT)0,v =(v1,...,vT)0和a =(.a0,a1)。我们将模型参数重新组合为向量y =(.a,b,n)。然后,在定义T×T对角矩阵时

我们可以将(y,v)表示为

贝叶斯方法将(y,v)视为随机变量,其特征在于以p(y,v)表示的先验密度。先验是在称为超参数的参数的帮助下指定的,这些参数最初假定为已知且恒定。而且,根据研究人员的先验信息,这种密度可能或多或少地提供信息。然后,通过将模型参数的似然函数与先验密度耦合,我们可以使用贝叶斯规则对概率密度进行变换,以得出后验密度p(y,vjy),如下所示:

该后验是观察数据后关于模型参数的知识的定量概率描述。
我们在GARCH参数a和b上使用了截距的普通先验

其中m•和S•是超参数,1f·g是指标函数,fNd是d维法向密度。可以发现以n为条件的向量v的先验分布,从而得出

在选择自由度参数的先验分布时,我们遵循Deschamps(2006)的方法。分布是参数l> 0且d≥2的平移指数

对于较大的l值,先验质量集中在d附近,并且可以通过这种方式对自由度施加约束。

实现的MCMC采样基于Ardia(2008)的方法,该方法的灵感来自Nakatsuma(1998)的先前工作。该算法由MH算法组成,其中GARCH参数按块更新(a对应一个块,b对应一个块),而自由度参数是使用优化的拒绝技术从转换后的指数源密度中采样的。该方法具有全自动的优点。

实例分析

我们将贝叶斯估计方法应用于(DEM / GBP)外汇对数收益率的每日观察值。样本时间为1985年1月3日至1991年12月31日,共1974个观测值。此数据集已被推广为GARCH时间序列软件验证的非正式基准。从这个时间序列中,前750个观测值用于说明贝叶斯方法。我们的数据集中的观察窗口摘录绘制在图1中。

我们对带有Student-t的GARCH(1,1)模型进行了改进,以拟合此观察窗的数据

  1. function (y, mu.alpha = c(0, 0),
  2. Sigma.alpha = 1000 * diag(1,2),
  3. mu.beta = 0, Sigma.beta = 1000,
  4. lambda = 0.01, delta = 2,
  5. control = list())

函数的输入自变量是数据向量,超参数,例如:
• 要生成的MCMC链数;默认值1。
• 每个MCMC链的长度;•start.val:链的起始值的向量;默认值为10000 。
作为贝叶斯估计的先验分布。通过设置控制参数值n.chain = 2和l.chain = 5000,我们为5000次传递生成了两条链。

  1. > MCMC <- bayg(y, control = list(
  2. l.chain = 5000, n.chain = 2))
  3. chain: 1 iteration: 10
  4. parameters: 0.0441 0.212 0.656 115
  5. chain: 1 iteration: 20
  6. parameters: 0.0346 0.136 0.747 136
  7. ...
  8. chain: 2 iteration: 5000
  9. parameters: 0.0288 0.190 0.754 4.67

生成MCMC链的跟踪图(即,迭代与采样值的图)。采样器的收敛(使用Gelman和Rubin(1992)的诊断测试),链中的接受率和自相关可以如下计算:

  1. diag
  2. Point est. 97.5% quantile
  3. alpha0 1.02 1.07
  4. alpha1 1.01 1.05
  5. beta 1.02 1.07
  6. nu 1.02 1.06
  7. Multivariate psrf
  8. 1.02
  9. > 1 - rejectionRate
  10. alpha0 alpha1 beta nu
  11. 0.890 0.890 0.953 1.000
  12. >
  13. autocorr.diag
  14. alpha0 alpha1 beta nu
  15. Lag 0 1.000 1.000 1.000 1.000
  16. Lag 1 0.914 0.872 0.975 0.984
  17. Lag 5 0.786 0.719 0.901 0.925
  18. Lag 10 0.708 0.644 0.816 0.863
  19. Lag 50 0.304 0.299 0.333 0.558

收敛诊断没有显示最后2500次迭代的收敛证据。MCMC采样算法的接受率非常高,从向量a的89%到b的95%不等,这表明分布接近于全部条件。我们丢弃了从MCMC的整体输出中抽样前2500次作为预烧期,仅保留第二次抽样以减少自相关,

  1. > smpl
  2. n.chain : 2
  3. l.chain : 5000
  4. l.bi : 2500
  5. batch.size: 2
  6. smpl size : 2500

基本的后验统计:

  1. Iterations = 1:2500
  2. Thinning interval = 1
  3. Number of chains = 1
  4. Sample size per chain = 2500
  5. 1. Empirical mean and standard deviation
  6. for each variable, plus standard error
  7. of the mean:
  1. Mean SD Naive SE Time-series SE
  2. alpha0 0.0345 0.0138 0.000277 0.00173
  3. alpha1 0.2360 0.0647 0.001293 0.00760
  4. beta 0.6832 0.0835 0.001671 0.01156
  5. nu 6.4019 1.5166 0.030333 0.19833

每个变量的分位数:

  1. 2.5% 25% 50% 75% 97.5%
  2. alpha0 0.0126 0.024 0.0328 0.0435 0.0646
  3. alpha1 0.1257 0.189 0.2306 0.2764 0.3826
  4. beta 0.5203 0.624 0.6866 0.7459 0.8343
  5. nu 4.2403 5.297 6.1014 7.2282 10.1204

通过首先将输出转换为矩阵,然后使用函数hist,可以获取模型参数的边际分布。

边缘后部密度显示在图3中。我们清楚地注意到直方图的不对称形状。对于参数n尤其如此。后平均值和中位数之间的差异也反映了这一点。这些结果应该警告我们,不要滥用渐近论证。在当前情况下,即使是750次观测也不足以证明参数估计量分布的渐近对称正态近似。
可以通过从联合后验样本中进行仿真来直接获得关于模型参数的非线性函数的概率陈述。
特别是,我们可以测试协方差平稳性条件,并在满足该条件时估计无条件方差的密度。根据GARCH(1,1)规范,如果a1 + b <1,则过程是协方差平稳的。值接近1时,过去的冲击和过去的方差将对未来的条件方差产生更长的影响。
为了推断平方过程的持久性,我们仅使用后验样本,并为后验样本中的每个绘制y [j]生成(a1 [j] + b [j])。持久性的后部密度绘制在图4中。直方图向左倾斜,中值为0.923,最大值为1.050。假设a1 + b <1,则GARCH(1,1)模型的无条件方差为a0 /(1- a1- b)。条件是存在时,后验均值为0.387,90%可信区间为[0.274,1.378 ]。经验方差为0.323。

使用联合后验样本可以获得关于模型参数的其他概率陈述。使用后验样本,我们估计条件峰度存在的后验概率为0.994。在存在条件下,峰度的后均值为8.21,中位数为5.84,对区间的95%置信度为[4.12,15.81],表明尾部比正态分布更重。条件峰度的后验正偏是由几个非常大的值(最大模拟值为404.90)引起的。

先前的限制和常规改进

控制参数addPriorConditions可用于在估计期间对模型参数y施加任何类型的约束。例如,为了确保估计协方差平稳GARCH(1,1)模型,应将函数定义为

  1. p<-function(psi)
  2. + psi[2] + psi[3] < 1

实用建议

该算法中实施的估算策略是全自动的,不需要对MCMC采样器进行任何调整。对于从业者来说,这无疑是一个吸引人的功能。但是,马尔可夫链的生成非常耗时,因此每天在多个数据集上估算模型可能会花费大量时间。在这种情况下,通过在多个处理器上运行单链可以轻松地使算法并行化。例如,可以使用foreach包轻松实现此目标(Revolution Computing,2010)。同样,当估计值在更新的时间序列(即具有最近观测值的时间序列)上重复时,明智的做法是使用在前一个估计步骤获得的参数的后验均值或中值来启动算法。初始值(预烧阶段)的影响可能较小,因此收敛速度更快。最后,请注意,与任何MH算法一样,采样器可能会卡在给定的值上,因此链不再移动。

总结

本说明介绍了Student-t改进对GARCH(1,1)模型的贝叶斯估计。我们举例说明了在汇率对数收益率上的实证应用。

参考书目

D. Ardia 使用GARCH模型的贝叶斯估计进行的金融风险管理:理论与应用,经济学和数学系统讲义第612卷。Springer-Verlag,德国柏林,2008年6月。ISBN978-3-540-78656-6。网址http://www.springer.com/economics/econometrics/book/978-3-540-78656-6。


最受欢迎的见解

1.HAR-RV-J与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频波动率

2.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

3.波动率的实现:ARCH模型与HAR-RV模型

4.R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

5.GARCH(1,1),MA以及历史模拟法的VaR比较

6.R语言多元COPULA GARCH 模型时间序列预测

7.R语言基于ARMA-GARCH过程的VAR拟合和预测

8.matlab预测ARMA-GARCH 条件均值和方差模型

9.R语言对S&P500股票指数进行ARIMA + GARCH交易策略

f分布表完整图a=0.01_R语言具有Student-t分布改进的GARCH(1,1)模型的贝叶斯估计...相关推荐

  1. f分布表完整图a=0.01_建筑电气工程图的一般规定

    建筑工程图的格式与幅面尺寸 1.图纸格式 一张图纸的完整图面是由边框线.图框线.标题栏.会签栏等组成的,其格式如图1-1所示. 图1-1 图纸格式示例 (a)留装订边;(b)不留装订边 2.图纸幅面尺 ...

  2. f分布表完整图a=0.01_使用 Infer.NET 评价竞争对手

    Infer.NET 是开放源代码的代码库,可用于创建概率性编程系统.我往往会将普通的计算机程序视作,主要基于有指定类型的值的变量(如有值"Q"的 char 变量).概率性编程主要基 ...

  3. f分布表完整图a=0.05_MySQL8.0新特性-invisible indexes

    作者 李春·沃趣科技首席架构师 出品 沃趣科技 作者简介: 曾就职于阿里巴巴,全程参与阿里数据架构从Oracle迁移到MySQL过程,参与分布式中间件Cobar设计. | 导语 MySQL 8.0版本 ...

  4. f分布表完整图a=0.05_2019年05月16日,沪深A股股票分析

    纽约华尔街,伦敦金融城,Tier 1投行,我们希望撕掉标签,用数据说话. 欢迎您留言和赞赏,谢谢.一.整体分析 我们选取了沪深A股的股票,利用历史数据对超过60种交易策略进行了预测回测. 下表中列出了 ...

  5. f分布表完整图a=0.01_自动控制原理2.2.2传递函数零极点,零点如何影响输出响应曲线...

    2.传递函数零点和极点 传递函数分子多项式和分母多项式经因式分解后可写为如下形式: Zi是分子多项式零点,称为传递函数零点,Pj是分母多项式零点,称为传递函数极点.系数K*=b0/a0称为传递函数系数 ...

  6. f分布表完整图a=0.01_SQL Server从入门到精通——学习笔记01(数据库基础知识篇)...

    1.1 数据库的概念 数据库(DataBase,DB):是存放数据的仓库,只不过这些数据存在一定的关联,并按一定的格式存放在计算机上. 1.2 数据库管理系统 数据库管理系统(DataBase Man ...

  7. f分布表完整图_【教育统计答疑】如何理解正态分布、均值分布、^2分布、t分布和F分布...

    许多教育统计的初学者都表示这几个分布感到学起来非常吃力,结合最近上课的体会以及答疑的情况,觉得很有必要在这里简单地对这部分内容进行澄清和梳理,以助理解. 首先,"为什么要学习这几个分布&qu ...

  8. f分布表完整图_分布式计算引擎之星——Spark

    点击上方"数风云"关注我们吧 文/李萌 Spark作为分布式计算引擎的一颗璀璨之星,继承了MapReduce分布式并行计算的优点,并改进了MapReduce明显的缺陷.它使用一种面 ...

  9. f分布表完整图_标准正态分布函数数值表怎么查?(加完整分布函数表)

    最近在整理数据时,忽然想到数理统计的其中一种分布,相信作为质量人一定不陌生,我们常常提到数据的分布是否服从正态分布,这是对一组连续数据分布一种描述,还会涉及到如何检验正态分布,对于这个分布的来龙去脉和 ...

  10. 狄利克雷分布的matlab代码实现和R语言函数调用

    主要参考的是:https://www.douban.com/note/45584915/ 和 http://www.biostatistic.net/thread-33740-1-1.html 最近需 ...

最新文章

  1. 无监督机器学习中,最常见的聚类算法有哪些?
  2. 一步一步学linq to sql(四)查询句法
  3. python怎么读取word文件_使用python编辑和读取word文档
  4. leetcode算法题--Can I Win
  5. 刘强东写在上市之际:京东要成为一家世界级企业 感慨吧
  6. 计算机专业 美国 硕士,【美国计算机硕士排名】美国计算机硕士专业怎么样
  7. web前端入门学习 css(3)(背景相关)
  8. .jar中没有主清单属性_面试官问:为什么SpringBoot的 jar 可以直接运行?
  9. android 方向控制界面,Android Studio屏幕方向以及UI界面状态的保存代码详解
  10. uploadify的使用错误
  11. 【转】WebSocket详解(一):初步认识WebSocket技术
  12. 再议指针和引用的一些事情吧
  13. Linux中的tty、pts、pty等概念辨析
  14. GridView自动序号
  15. php怎么遍历json字符串数组,php-使用jquery遍历json数组
  16. 点击编辑,进入编辑页面并把值渲染到页面上
  17. Mac软件下载提示:“已损坏,无法打开”解决办法
  18. RGB色彩,HSV色彩模式、灰度图,亮度,对比度,饱和度、图像平滑、降噪、锐化、增强
  19. 百兆宽带插网线只有1mb/s的下载速度问题!
  20. oracle库存计算公式,问安全库存量计算公式

热门文章

  1. 6. lcd驱动1-硬件原理
  2. 上位机和下位机笔记总结
  3. 苹果 macOS 系统键盘快捷键列表大全整理
  4. ureport2项目使用
  5. C# 连接本地数据库
  6. 第九讲 函数间接展开成幂级数
  7. tp5调用阿里云短信接口
  8. 问题:虚拟机安装Ubuntu时,显示PXE-MOF:Exiting Intel PXE ROM.Operating Systen not found
  9. Matlab 2010b再次打开安装问题
  10. 淘宝天猫融合能拉回“出淘”的用户吗?