一、理论模型
本文选择向量自回归模型,简称VAR模型,是一种常用的计量经济模型,加粗样式1980年由克里斯托弗·西姆斯(Christopher Sims)提出。VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。VAR模型用来估计联合内生变量的动态关系,而不带有任何事先约束条件。它是AR模型的推广,此模型目前已得到广泛应用。
  向量自回归(VAR)是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。VAR模型是处理多个相关经济指标的分析与预测最容易操作的模型之一,并且在一定的条件下,多元MA和ARMA模型也可转化成VAR模型,因此近年来VAR模型受到越来越多的经济工作者的重视。
VAR模型描述在同一样本期间内的n个变量(内生变量)可以作为它们过去值的线性函数。
  一个VAR(p)VAR(p)VAR(p)模型可以写成为:
Yt=c+A1Yt−1+...+ApYt−p+etY_{t} =c+A_{1}Y_{t-1} +...+A_{p}Y_{t-p}+e_{t}Yt​=c+A1​Yt−1​+...+Ap​Yt−p​+et​
其中:c是n×1常数向量,Ai是n×n矩阵。et是n×1误差向量,满足:误差项的均值为0;误差项的协方差矩阵为Ω(一个n×n正定矩阵);对于所有不为0的k都满足误差项不存在自相关.

二 、研究方法
(1)数据处理
由于数据的自然对数变换不改变原有的协整关系,并能使其趋势线性化,消除时间序列中存在的异方差现象,所以对所有数据取其自然对数值,以增强数据线性化趋势消除异方差,同时便于考察各变量对我国出国留学人数的敏感性。
(2)单位根检验
在对时间序列数据进行回归分析之前,为了避免伪回归,要先进行时间序列数据的平稳性检验,即单位根检验。如果时间序列数据满足:均值是与时间t无关的常数;方差是与时间t无关的常数;协方差是只与间隔K有关,与时间t无关的常数;则称此时间序列是平稳的。简言之,就是时间序列数据围着某一特定均值上下波动。
(3)协整分析
协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。协整检验主要有EG两步法和JJ检验。EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性,而JJ检验是基于回归系数的检验,前提是建立VAR模型(即模型符合ADL模式)。然而EG两步法在样本容量有限的条件下,对参数的估计存在偏差,且随着样本的增大,其估计偏差也在增大。
(4)Granger因果检验
格兰杰因果关系检验是一种假设检定的统计方法,检验一组时间序列x是否为另一组时间序列y的原因。它的基础是回归分析当中的自回归模型。回归分析通常只能得出不同 变量间的同期相关性;自回归模型只能得出同一变量前后期的相关性.

三、数据与描述统计
1、数据来源
本文选择我国出国留学人数、我国失业率、我国居民消费水平、我国研究生在学人数。选取1988-2018年的数据,共31组数据,具体变量说明如下:

变量 变量说明 取值 解释说明
NAB 我国出国留学人数 ≥0 单位万人,数据来自《中国统计年鉴》
CON 我国居民消费水平 ≥0 单位元, 数据来自《中国统计年鉴》
NPO 我国研究生在学人数 ≥0 单位万人,数据来自《中国统计年鉴》

2、描述数据

Mean Median Maximum Minimum Std. Dev.
NAB 18.31 11.73 66.21 0.29 20.58
CON 7839.39 4606.00 25002.00 684.00 7318.64
NPO 31.59 26.89 85.80 2.86 26.45

由上表可知,NAB的均值为18.31,最小值为0.29,最大值为66.21,标准差为20.58,说明NAB数据离散程度较大,数据波动较大,且总体出口留学人数一般。
CON的均值为7839.39,最小值为684.00,最大值为25002.00,标准差为7318.64,说明CON数据离散程度较大,数据波动较大,且总体居民消费水平一般。
NPO的均值为31.59,最小值为2.86,最大值为85.80,标准差为26.45,说明NPO数据离散程度较大,数据波动较大,且总体研究生在学人数一般。

四、实证分析
1、ADF单位根检验
本次选择迪克一富勒检验法, 即ADF检验,分别对LnNAB、LnCON、LnNPO的原序列、一阶差分进行无截距项和时间趋势ADF检验,结果如下。

变量名 差分阶数 ADF值 1%临界 5%临界 10%临界 平稳性
LnNAB 0.37414 -4.39431 -3.6122 -3.24308
-6.71578 -4.39431 -3.6122 -3.24308 1%
LnCON -3.16829 -4.30982 -3.57424 -3.22173
-3.95710 -4.32398 -3.58062 -3.22533 5%
LnNPO -0.31093 -4.30982 -3.57424 -3.22173
-15.6969 -4.30982 -3.57424 -3.22173 1%

根据ADF值和临界值来判断时间序列的平稳性,若ADF小于某个临界值,则拒绝原假设,可以认为时间序列在某个临界值上是平稳的;若ADF大于所有临界值,则接受原假设,可以认为时间序列是非平稳的。
由上表可知,LnNAB、LnCON、LnNPO的原序列的ADF值均大于所有的临界值,即以上经济变量的原序列都是非平稳的。于是对上述变量进行一阶差分,结果显示LnNAB、LnNPO为1%平稳,LnCON为5%平稳。
综上所述,LnNAB、LnCON、LnNPO为一阶单整。因变量LnNAB的单整阶数最低,因此可以进行协整分析。

2、协整分析
由方法介绍可知,我们选择JJ检验,从而降低估计偏差。具体结果所示。

Hypothesized Eigenvalue Trace Statistic 0.05 CriticalValue Prob.
None * 0.642242 42.54298 29.79707 0.0010
At most 1 0.264461 12.73395 15.49471 0.1249
At most 2 0.123615 3.82654 3.841466 0.0504

由上表可知,当假设三个变量之间无协整关系时,其P=0.0010<0.05,说明结果显著,即拒绝原假设,可以认为三个变量之间存在协整关系; 当假设至多两个变量之间有协整关系时,其P=0.0504<0.1,说明结果显著,即拒绝原假设,可以认为在90%的置信区间下,三个变量之间至少两个个存在协整关系。

3、确定模型滞后阶数
由协整分析可知,出国留学人数、居民消费水平和研究生在学人数存在协整关系,且至多两个协整,且为同阶单整,可以做VAR模型,且通过初次VAR模型确定模型滞后阶数。

Lag LogL LR FPE AIC SC HQ
0 -37.3676 NA 0.003992 2.990191 3.134173 3.033005
1 86.59175 211.19 8.05E-07 -5.52531 -4.94939 -5.35406
2 110.8634 35.958 2.68E-07 -6.65655 -5.64868 -6.35685
3 127.7608 21.27818* 1.61E-07 -7.24154 -5.801720* -6.81341
4 140.1621 12.86063 1.45e-07* -7.493488* -5.62172 -6.936915*

某行星号最多,就选择某行的滞后阶数。由上表可知,当滞后阶数为4阶时,其FRE、AIC、HQ值均为最小,于是选择最优滞后阶数为4阶。

4、变量外生性检验
本文利用Granger因果检验来检验变量的外生性。Granger因果检验是建立VAR模型的前提检验,如果变量X不是变量Y的Granger因果原因,那么就不能做VAR模型。具体结果如下。

Excluded Chi-sq df Prob
LNCON 14.46924 4 0.0059
LNNPO 18.96715 4 0.0008
All 14.46924 4 0.0059

原假设为居民消费指数和研究生在学人数不是影响出国留学人数的格兰杰因果原因。由上表可知,其检验P值分别为0.0059、0.0008,均小于0.01,说明结果显著,即拒绝原假设,可以认为在99%的置信区间下,居民消费指数和研究生在学人数是影响出国留学人数的格兰杰因果原因。即居民消费指数和研究生在学人数对出国留学人数有预测能力。也就是说,居民消费指数和研究生在学人数是出国留学人数的内生性变量。所建立的VAR模型是有意义的。

5、建立VAR模型
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210509133505705.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzMjg2ODk4,size_16,color_FFFFFF,t_70#pic_center
在上表中, 上行表示变量系数,下行表示变量系数的T检验值。由上表可知,模型调整后的R方为0.993833,说明对出国留学人数的解释率为99.3833%,模型拟合效果很好。F=350.1718,大于F临界值,说明模型方程显著。且各系数T检验值均大于各临界值,故模型方程显著,即方程为:
LNNAB = 0.371181LNNAB(-1) +0.008448LNNAB(-2) -0.41694LNNAB(-3) -0.11502LNNAB(-4) + 0.758688LNCON(-1) + 0.115902LNCON(-2) -1.00418LNCON(-3) +1.060701LNCON(-4) + 1.049009LNNPO(-1) -0.26145LNNPO(-2) -0.16366LNNPO(-3) + 0.129931LNNPO(-4) -7.73947

6、判断模型稳定性
如果VAR模型所有根模的倒数都小于1,即都在单位圆内,则该模型是稳定的;如果VAR模型所有根模的倒数都大于1即都在单位圆外,则该模型是不稳定的。如果被估计的VAR模型不稳定・则得到的结果有些是无效的。(如脉冲响应函数的标准误差)
由上图可知,各变量的AR根的根模的倒数都小于1,即都在单位圆内。所以,我们建立的VAR模型是稳定的,可以进行脉冲响应分析和方差分析

7、脉冲响应分析
由之前分析可知,此VAR模型是稳定的,于是选择脉冲响应分析。且考虑出国留学人数对自身的脉冲响应和居民消费指数、研究生在学人数对出国留学人数的影响。具体如下图所示。

由上图可知,出国留学人数自身在第6期下降至最低,再有一个小的冲击,使得出国留学人数在第6期开始缓慢增长,至第9期到达最高,再有所下降。其原因可能是,随着出国热的兴起,其出国人数在第1期达到饱和,然后开始下滑,下滑至最低点,又开始上升,但始终处于非饱和状态。

上图为居民消费水平对出国留学人数的脉冲响应图。由上图可知,第1期居民消费水平对出国留学人数没有影响,在第2期有个小小的冲击,使得出国留学水平有所增长,然后开始有所下降,降至低6期最低,接着开始缓慢上升。

上图为研究生在学人数对出国留学人数的脉冲响应图。由上图可知,第1期研究生在学人数对出国留学人数没有影响,在第2期有个小小的冲击,使得出国留学人数有所增长,然后开始有所下降,且一直呈现缓慢下降趋势。

7、方差分解
方差分解是通过分析每一个结构冲击对内生变量变化(通常用方差来衡量)的贡献度,进一步评价不同结构冲击的重要性。因此,方差分解给出对VAR模型中的变量产生影响的每个随机扰动的相对重要性的信息。具体结果如下表所示。

Period S.E. LNNAB LNCON LNNPO
1 0.110012 100.0000 0.000000 0.000000
2 0.129826 82.39752 0.568039 17.03444
3 0.140567 70.30479 1.500835 28.19438
4 0.150305 67.42144 2.711806 29.86675
5 0.166193 61.63444 11.13326 27.23230
6 0.178425 59.02392 16.30791 24.66817
7 0.179908 59.26488 16.17539 24.55973
8 0.183096 57.32232 18.72532 23.95236
9 0.192636 52.71040 25.43060 21.85901
10 0.202548 48.12188 31.77471 20.10341

由上表可知,在第1期,出国留学人数的信息解释均由自身解释。且从第2期开始,出国留学人数的信息解释率开始下降,居民消费水平和研究生在学人数的信息解释率开始上升,其具体变化如下图可知。
由上图可知,出国留学人数自身的信息解释率一直呈现出不断下降的趋势。居民消费水平对出国留学人数的信息解释率呈现不断上升的趋势。而研究生在学人数对出国留学人数的信息解释率在短期内增长较快,随后开始持平,后期开始有所下降。说明随着时间的增长,出国留学人数滋生的影响开始有所下降,研究在学人数短期影响较大,长期较均衡,居民消费水平对出国留学的影响则是不断增大。

8、模型预测
将时间序列扩大值2025年,用已建立的VAR模型进行拟合与预测。具体结果如下图表所示。

时间 2019 2020 2021 2022 2023 2024 2025
出国留学人数 92.6369 100.2244 108.6935 120.0713 135.1615 153.0895 171.6604

由上表可以,根据建立的VAR模型预测未来7年的出国留学人数呈现增长的趋势,且增长幅度在逐步增大。
由上图可知,本文所建立的VAR模型对已有数据的拟合程度较高,大部分均重合,且波动在正常范围内。未来7年的预测数据显示,数据略成指数增长趋势,即增长速度逐步增加,波动范围逐渐削减。

以上是全部过程。完整的论文以及《结婚率的影响因素分析》完整可在资源处下载。

基于VAR模型出国留学人数增加的影响因素分析相关推荐

  1. 暴利项目揭秘 出国留学中介 你镀金,我淘金

    暴利如何取得 1.阳光利润,名正言顺 一般来说,成功留学所需代理费用1-2万元左右,办不成的,扣掉所谓成本费用,其它退还.所以留学中介是一个稳赚不赔的生意.办成了,自然有高额利润,办不成,支出有人买单 ...

  2. R语言Logistic回归模型案例:低出生婴儿体重的影响因素分析(列线图、校准曲线)

    R语言Logistic回归模型案例:低出生婴儿体重影响因素分析(列线图.校准曲线) 目录 R语言Logistic回归模型案例:低出生婴儿体重影响因素分析(列线图.校准曲线ÿ

  3. 非期望产出的sbm模型_出国留学花费和回国薪水对比,投入产出比高吗?

    点击上方蓝字关注我们! 出国留学花费和回国薪水对比,投入产出比高吗? 在计划是否出国留学时,不菲的花销是很多人考虑的重要因素.在网络问答社区网站知乎上,"留学1年花费多少"的问题下 ...

  4. 基于SEIR模型对美国COVID-19疫情传播的预测和分析

    原文链接:易安的小窝 https://jingblog.tech/2022/09/22/mei-guo-xin-guan-yi-qing-yu-ce/ 1.思路 基于每日发布的COVID-19确诊感染 ...

  5. 电商用户价值分析——基于RFM模型、KMeans聚类

    电商用户价值分析--基于RFM模型.KMeans聚类 一.背景 二.RFM模型.KMeans聚类 三.分析框架 四.具体分析 1. 导入所需的库 2. 导入数据 3. 数据清洗 4. 数据分析 4.1 ...

  6. 【VAR模型 | 时间序列】帮助文档:VAR模型的引入和Python实践(含源代码)

    向量自回归 (VAR) 是一种随机过程模型,用于捕获多个时间序列之间的线性相互依赖性. VAR 模型通过允许多个进化变量来概括单变量自回归模型(AR 模型). VAR 中的所有变量都以相同的方式进入模 ...

  7. 基于BERT-PGN模型的中文新闻文本自动摘要生成——文本摘要生成(论文研读)

    基于BERT-PGN模型的中文新闻文本自动摘要生成(2020.07.08) 基于BERT-PGN模型的中文新闻文本自动摘要生成(2020.07.08) 摘要: 0 引言 相关研究 2 BERT-PGN ...

  8. Eviews基于多元回归模型OLS的CPI影响因素分析

    全文链接:http://tecdat.cn/?p=32104 2015年以来,通货膨胀越来越成为我国的重要经济现象.作为衡量通货膨胀的主要指标,CPI(消费者物价指数)与人们的生活具有最密切的关系(点 ...

  9. 考研考公太卷了,出国留学能弯道超车吗?

    这届年轻人太难了! 国内高考人数越来越多,考上好大学的难度很大.2022年,高考报名人数是1193万,但考上本科的只有466万,考上双一流大学的不足50万,上双一流大学考生的比例不到5%. 高考只是卷 ...

  10. Matlab基于SEIRD模型,NSIR预测模型,AHP层次分析法新冠肺炎预测与评估分析

    全文链接:http://tecdat.cn/?p=32175 分析师:Jiahui Zhao 新型冠状病毒肺炎COVID-19 给中国乃至全世界都带来了深重的灾难,对世界经济也造成了不可逆的影响(点击 ...

最新文章

  1. 关于tail, head ,less ,more ,cat 之小介------Linux命令
  2. 分布式系统中只有两个难题
  3. 作者赠送的《我的第一本c++书》收到啦
  4. Volatile可见性
  5. pixelbook安装linux系统,谷歌Pixelbook可以运行Fuchsia操作系统 正测试
  6. 山东计算机类好的民办大学,2021年山东所有民办大学名单及排名(教育部)
  7. Linux串口编程详解
  8. ul li前面的点怎么变大_硅片尺寸变大,生产成本降低,光伏电池生产商转向更大尺寸硅片...
  9. 2018: 跑图(深搜)
  10. linux修改yum本地源的方法
  11. WPF制作简易串口调试助手(上位机部分)
  12. 10款常用的Linux音乐播放器,10款常用的Linux音乐播放器
  13. (转)Windows gcc(MinGW32)配置-慢!!!
  14. IT-RS-OSPF-V-link_Looped
  15. spring boot火车票预订系统毕业设计-附源码091029
  16. C. New Year Ratings Change
  17. 叫我大掌柜怎么改地区
  18. 零基础学习单片机切记这四点要求,少走弯路
  19. iOS CALayer专用图层理解与使用方法一(CAShapeLayer、CATextLayer、CATransformLayer)
  20. 商业Web应用程序的用户界面设计

热门文章

  1. B样条曲线与贝塞尔曲线学习笔记
  2. 华为手机 图标消失_华为手机桌面图标不见了怎么办
  3. xbox one 手柄按键测试软件,Xbox One手柄映射工具(ReWASD)
  4. mysql 定时备份和远程备份脚本
  5. Linux 交叉编译工具链
  6. python网易云音乐爬虫歌词_利用Python网络爬虫抓取网易云音乐歌词
  7. 决策树和CART决策树
  8. java 开发技术,Java 后端开发技术有哪些?
  9. linux如何卸载干净mysql
  10. idea插件开发教程