绪论

上海证券综合指数简称“上证指数”或“上证综指”,其样本股是在上海证券交易所全部上市股票,包括A股和B股,反映了上海证券交易所上市股票价格的变动情况,自1991年7月15日起正式发布。

2017年11月23日,A股低开低走,全线深幅调整。上证综指失守3400点整数位,创下年内最大单日跌幅。上一交易日率先回调的深市三大股指同步出现3%以上的跌幅。

上证综合指数是最早发布的指数,是以上证所挂牌上市的全部股票为计算范围,以发行量为权数的加权综合股价指数。这一指数自1991年7月15日起开始实时发布,基日定为1990年12月19日,基日指数定为100点。

中国股票市场虽然起步较晚,但其发展是相当迅猛的,尤其是进入2000年以后,中国的股市更加活跃了。在价格变化多端的股票市场中,投资者们因盲目买卖股票使自己的收益或盈或亏,大多数会带有从众或投机的心理去投资,从而形成一定形式的买卖跟风。股票市场价格序列的残差都具有时变波动性、波动集聚等特点,但是传统的时间序列分析方法无法很好的刻画和解释这一点,恩格尔(Engle)于1982年提出了“条件异方差自回归模型”简称ARCH模型,它能集中地反映方差的变化特点,现已被广泛地应用于经济领域的时间序列分析、验证金融理论中的规律描述、金融市场的预测和决策。因此本文基于ARCH模型结合沪深两证券交易所大盘的收盘价格指数日数据及其波动变化进行实证分析,借鉴国内外专家已有的研究成果,运用极大似然估计方法、ARCH LM检验和残差的白噪声检验等一系列时间序列分析方法,对大盘的日收盘价格指数的波动进行实证分析并对其短期内的走势做出试探性预测。

关键词:上证综指, Arch,Garch,均值模型,波动率模型

  • 研究背景

中国股票市场起步的相对于国外的股票市场较晚,但其发展是相当迅猛的。无论是国内还是国外,股票市场的价格序列残差都具有时变波动性、波动集聚等特点,为了能够运用更好的分析方法来解释这一点,许多经济学家开始尝试用不同的模型和方法来解决这个问题。其中具有代表性的是恩格尔(Engle)提出的“条件异方差自回归模型”,简称ARCH模型。因此,利用ARCH类模型分析股票市场的波动特性并对其进行分析具有一定的理论和现实意义。在对股市行情中的研究中,需涉及到时间序列分析这一学科中的ARCH模型分析,经过近二十年的发展,目前该模型已被认为是最集中地反映了方差的变化特点,从而广泛地应用于经济领域的时间序列分析。对金融市场不确定性的探讨和实证分析,是现代金融研究的核心问题之一。近年发展起来的金融市场价格波动非线性时间序列模型及其分析方法,在理论探讨和实际应用方面,都取得迅速的进展,形成了ARCH类计量模型[1]。

  • 研究现状

自进入21世纪,中国经济稳健而快速的发展着。我国的证券市场成为经济市场中不可或缺的重要部分[6],越来越具备投资理财意识的现代人把自己的热钱从部分的储蓄里拿出投资到其中,以上海和深圳为代表的股票市场在这样的投资活动中变得更加活跃了。尤其是2006年股市中的投资者们基本上都能盈利,于是更多的人也就跟着进入,形成一定形式的买卖跟风。但是,从2007年美国次贷危机开始席卷各国金融市场,使得中国股票市场在2008年一直处于低迷的熊市状态。许多投资者对此持观望态度,不愿意将热钱倾注于现在的股票市场中。现本文将对我国股票市场的沪深股市的大盘收盘价格指数进行以下的实证分析。

三.数据收集整理

1.数据收集

根据分析所需内容,搜集以下数据:

2005年1月到2018年4月上证综指月度数据

(数据来源:中经网统计数据库)

2.数据整理

将以上数据整理成表:

time

closeprice

time

closeprice

2005-01

1191.82

2011-09

2359.22

2005-02

1306

2011-10

2468.25

2005-03

1181.24

2011-11

2333.41

2005-04

1159.15

2011-12

2199.42

2005-05

1060.74

2012-01

2292.61

2005-06

1080.94

2012-02

2428.49

2005-07

1083.03

2012-03

2262.79

2005-08

1162.8

2012-04

2396.32

2005-09

1155.61

2012-05

2372.23

2005-10

1092.82

2012-06

2225.43

2005-11

1099.26

2012-07

2103.63

2005-12

1161.1

2012-08

2047.52

2006-01

1258.1

2012-09

2086.17

2006-02

1299

2012-10

2068.88

2006-03

1298.3

2012-11

1980.12

2006-04

1440.2

2012-12

2269.13

2006-05

1641.3

2013-01

2385.42

2006-06

1672.2

2013-02

2365.59

2006-07

1612.7

2013-03

2236.62

2006-08

1658.6

2013-04

2177.91

2006-09

1752.4

2013-05

2300.6

2006-10

1838

2013-06

1979.21

2006-11

2099.3

2013-07

1993.8

2006-12

2675.5

2013-08

2098.38

2007-01

2786.3

2013-09

2174.67

2007-02

2881.1

2013-10

2141.61

2007-03

3184

2013-11

2220.5

2007-04

3841.3

2013-12

2115.98

2007-05

4109.7

2014-01

2033.08

2007-06

3820.7

2014-02

2056.3

2007-07

4471

2014-03

2033.31

2007-08

5218.8

2014-04

2026.36

2007-09

5552.3

2014-05

2039.21

2007-10

5954.8

2014-06

2048.33

2007-11

4871.8

2014-07

2201.56

2007-12

5261.6

2014-08

2217.2

2008-01

4383.4

2014-09

2363.87

2008-02

4348.54

2014-10

2420.18

2008-03

3472.71

2014-11

2682.84

2008-04

3693.11

2014-12

3234.68

2008-05

3433.35

2015-01

3210.36

2008-06

2736.1

2015-02

3310.3

2008-07

2775.72

2015-03

3747.9

2008-08

2397.37

2015-04

4441.66

2008-09

2293.78

2015-05

4611.74

2008-10

1728.79

2015-06

4277.22

2008-11

1871.16

2015-07

3663.73

2008-12

1820.81

2015-08

3205.99

2009-01

1990.66

2015-09

3052.78

2009-02

2082.85

2015-10

3382.56

2009-03

2373.21

2015-11

3445.41

2009-04

2477.57

2015-12

3539.18

2009-05

2632.93

2016-01

2737.6

2009-06

2959.36

2016-02

2687.98

2009-07

3412.06

2016-03

3003.92

2009-08

2667.75

2016-04

2938.32

2009-09

2779.43

2016-05

2916.62

2009-10

2995.85

2016-06

2929.61

2009-11

3195.3

2016-07

2979.34

2009-12

3277.14

2016-08

3085.49

2010-01

2989.29

2016-09

3004.7

2010-02

3051.94

2016-10

3100.49

2010-03

3109.11

2016-11

3250.03

2010-04

2870.61

2016-12

3103.64

2010-05

2592.15

2017-01

3159.17

2010-06

2398.37

2017-02

3241.73

2010-07

2637.5

2017-03

3222.51

2010-08

2638.8

2017-04

3154.66

2010-09

2655.66

2017-05

3117.18

2010-10

2978.84

2017-06

3192.43

2010-11

2820.18

2017-07

3273.03

2010-12

2808.08

2017-08

3360.81

2011-01

2790.69

2017-09

3348.94

2011-02

2905.05

2017-10

3393.34

2011-03

2928.11

2017-11

3317.19

2011-04

2911.51

2017-12

3307.17

2011-05

2743.47

2018-01

3480.83

2011-06

2762.08

2018-02

3259.41

2011-07

2701.73

2018-03

3168.9

2011-08

2567.34

2018-04

3082.23

3.时间序列对象

本数据分析将使用R stdio 3.4.4。

4. .绘制时间序列图

4.1平稳性检验

(一)绘制原始上证综指序列的时序图

> da<-read.xlsx("C:/Users/26259/Documents/R/shangzheng2.xlsx")

>   head(da)

time closeprice

1 2005-01    1191.82

2 2005-02    1306.00

3 2005-03    1181.24

4 2005-04    1159.15

5 2005-05    1060.74

6 2005-06    1080.94

> closeprice=log(da$closeprice+1)

> rtn=ts(closeprice,frequency = 12,start = c(2005,1))

> plot(rtn,xlab='year',ylab='ln-rtn')

> t.test(closeprice)

One Sample t-test

data:  closeprice

t = 278.13, df = 159, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 0

95 percent confidence interval:

7.783276 7.894605

sample estimates:

mean of x

7.838941

> Box.test(closeprice,lag=12,type = 'Ljung')

Box-Ljung test

data:  closeprice

X-squared = 787.44, df = 12, p-value < 2.2e-16

T.test 和Box.test统计量表明p值接近于0,表明序列没有显著的序列相关性。

4.2模型及方法介绍

4.2.1.建立ARCH模型

ARCH模型建立大致分为以下几步:

步骤(1):通过检验数据的序列相关性建立一个均值方程,如有必要,对收益率序列建立一个计量经济模型(如ARMA)来消除任何线形依赖。

步骤(2):对均值方程的残差进行ARCH效应检验

步骤(3):如果具有ARCH效应,则建立波动率模型

步骤(4):检验拟合的模型,如有必要则进行改进

  1. 均值模型

做出acf图,确定模型阶数:

> cp=log(da$closeprice+1)

> rtn=ts(cp,frequency = 12,start = c(2005,1))

> plot(rtn,type='1')

> x=diff(rtn,4)

> y=diff(rtn)

> sy=diff(y)

> acf(rtn,lag=20)

> acf(x,lag=20)

> acf(y,lag=20)

> acf(sy)

> m1=arima(rtn,order=c(1,0,0),seasonal=list(order=c(0,1,1),perid=4))

> m1

Call:

arima(x = rtn, order = c(1, 0, 0), seasonal = list(order = c(0, 1, 1), perid = 4))

Coefficients:

ar1     sma1

0.9930  -0.9999

s.e.  0.0216   0.0931

sigma^2 estimated as 0.007215:  log likelihood = 139.31,  aic = -272.62

Box.test(m1$residuals,lag=12,type = 'Ljung')

Box-Ljung test

data:  m1$residuals

X-squared = 25.142, df = 12, p-value = 0.08416

因为对应的Ljung-box统计量的p值>0.05,所以拟合模型能充分描述数据中的序列相关性。

> armamodel=arima(rtn)

> armamodel

Call:

arima(x = rtn)

Coefficients:

intercept

7.8389

s.e.     0.0281

sigma^2 estimated as 0.1263:  log likelihood = -61.51,  aic = 127.01

(2)由于均值方程为简单的常数加新息,所以用y=rt-r来检验ARCH效应,这里r是rt的样本均值,yt是at的估计。Yt^2的Ljung-Box统计量Q(12)=640.79,其p值接近于0,因此表明它有很强的ARCH效应。

R代码演示:

> y=closeprice-mean(closeprice)

>  Box.test(y^2,lag=12,type = 'Ljung')

Box-Ljung test

data:  y^2

X-squared = 640.79, df = 12, p-value < 2.2e-16

(3)模型估计和检验

> library(fGarch)

载入需要的程辑包:timeDate

载入需要的程辑包:timeSeries

载入需要的程辑包:fBasics

> resi=(residuals(m1,standardize=T))

> acf(resi,lag=20)

> pacf(resi,lag=20)

从PACF图中,我们看出在间隔为1,2,16上有显著的相关性,为保持模型简单,我们对波动率建立一个ARCH(2)模型,相应地,我们为上证综指月度数据建立以下形式的波动率模型:

假定εt是独立同分布的标准正态序列,我们得到的拟合模型是:

Rt=7.9875+at, δt^2=0.0040+0.9999a2t-1+0.0001 a2t-2

其中,各个参数估计值的标准误差分别是3.529e-02,2.225e-03,2.034e-01,2.182e-01,参见下面的R输出结果,尽管估计值满足ARCH(3)模型的一般要求,但α2的估计值在0.05的水平下不是统计显著的,因此模型可以简化。

R代码演示:

> m1=garchFit(~1+garch(2,0),data=closeprice,trace = F)

> summary(m1)

Title:

GARCH Modelling

Call:

garchFit(formula = ~1 + garch(2, 0), data = closeprice, trace = F)

Mean and Variance Equation:

data ~ 1 + garch(2, 0)

<environment: 0x0000000019d2ff80>

[data = closeprice]

Conditional Distribution:

norm

Coefficient(s):

mu       omega      alpha1      alpha2

7.98749489  0.00401985  0.99999999  0.00000001

Std. Errors:

based on Hessian

Error Analysis:

Estimate  Std. Error  t value Pr(>|t|)

mu     7.987e+00   3.529e-02  226.368  < 2e-16 ***

omega  4.020e-03   2.225e-03    1.807   0.0708 .

alpha1 1.000e+00   2.034e-01    4.916 8.82e-07 ***

alpha2 1.000e-08   2.182e-01    0.000   1.0000

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Log Likelihood:

17.0278    normalized:  0.1064237

Description:

Mon May 21 08:35:54 2018 by user: 26259

Standardised Residuals Tests:

Statistic p-Value

Jarque-Bera Test   R    Chi^2  8.015361  0.01817551

Shapiro-Wilk Test  R    W      0.9294648 4.455211e-07

Ljung-Box Test     R    Q(10)  403.6291  0

Ljung-Box Test     R    Q(15)  408.2778  0

Ljung-Box Test     R    Q(20)  409.9474  0

Ljung-Box Test     R^2  Q(10)  7.758695  0.6523939

Ljung-Box Test     R^2  Q(15)  9.657796  0.8406957

Ljung-Box Test     R^2  Q(20)  13.44348  0.8575561

LM Arch Test       R    TR^2   6.52695   0.8872287

Information Criterion Statistics:

AIC         BIC         SIC        HQIC

-0.16284745 -0.08596811 -0.16405729 -0.13162941

图4-4显示的是标准化的残差,PACF图表明在标准化残差的平方序列的高阶间隔上仍然有序列相关性。

标准化残差at的Ljung-Box统计量为Q(10)=403.63,p值为0,而Q(20)=409.95,p值为0,at2的Ljung-Box统计量为Q(10)=7.76,p=-0.65,at2的Ljung-Box统计量为Q(20)=13.44,p=0.85.因此,如果只是关注高阶的模型,那么在0.05的显著性水平下,ARCH(2)模型就能充分地描述给定数据的条件异方差性。

> "archTest" <- function(rtn,m=10){

+     # Perform Lagrange Multiplier Test for ARCH effect of a time series

+     # rtn: time series

+     # m: selected AR order

+     #

+     y=(rtn-mean(rtn))^2

+     T=length(rtn)

+     atsq=y[(m+1):T]

+     x=matrix(0,(T-m),m)

+     for (i in 1:m){

+         x[,i]=y[(m+1-i):(T-i)]

+     }

+     md=lm(atsq~x)

+     summary(md)

+ }

> archTest(closeprice)

Call:

lm(formula = atsq ~ x)

Residuals:

Min       1Q   Median       3Q      Max

-0.20795 -0.01912 -0.00575  0.01437  0.22267

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept)  0.009183   0.005444   1.687  0.09389 .

x1           0.980898   0.080897  12.125  < 2e-16 ***

x2           0.176958   0.114598   1.544  0.12482

x3          -0.502028   0.114311  -4.392 2.21e-05 ***

x4           0.319990   0.120080   2.665  0.00861 **

x5           0.064114   0.120771   0.531  0.59635

x6          -0.322010   0.120827  -2.665  0.00861 **

x7           0.129510   0.119943   1.080  0.28212

x8           0.078734   0.112441   0.700  0.48496

x9          -0.176240   0.108607  -1.623  0.10691

x10          0.119150   0.073997   1.610  0.10962

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.05265 on 139 degrees of freedom

Multiple R-squared:  0.8772,   Adjusted R-squared:  0.8684

F-statistic:  99.3 on 10 and 139 DF,  p-value: < 2.2e-16

ARCH效应检验表明上证综指月度序列有显著的ARCH效应。

(4)画图

> plot(m1)

Make a plot selection (or 0 to exit):

1:   Time Series

2:   Conditional SD

3:   Series with 2 Conditional SD Superimposed

4:   ACF of Observations

5:   ACF of Squared Observations

6:   Cross Correlation

7:   Residuals

8:   Conditional SDs

9:   Standardized Residuals

10:   ACF of Standardized Residuals

11:   ACF of Squared Standardized Residuals

12:   Cross Correlation between r^2 and r

13:   QQ-Plot of Standardized Residuals

5.总结及建议

5.1 我国股市存在异方差性

从上海证券交易所的收盘价格指数波动的统计特征呈现出明显的尖峰厚尾特征及残差的线图,到ARCH LM检验出的结果,可看出我国股市是存在很强的异方差性的。

5.2 ARCH类模型能够消除股市异方差

通过时间序列分析的ARCH模型和GARCH模型能够很好的描述大盘股票收盘价格指数波动变化的尖峰厚尾特征,经过ARCH LM检验及残差平方图的显示,发现大盘股价收盘指数的异方差性确实是被消除了。对于此,ARCH模型能够更加广泛的应用于股票市场行情的分析中。

参考文献

[1] (美)博迪等著,朱宝宪等译.投资学[M]. 北京:机械工业出版社,2007.12

[2] 胡海鹏,方兆本.股市波动性预测模型改进研究[J].数理统计与管理,2004(9)

[3] 郑梅,苗佳,王升.预测沪深股市市场波动性[J],系统工程理论与实践,2005

[4] 唐小凤.ARCH模型在金融市场中的应用[J].数学研究,2007.3

[5] 严定琪,李育锋.基于GARCH族模型的沪深300指数波动率预测[J].兰州交通大学学报,2008(2)

基于波动率模型对上证综指的建模与实证分析相关推荐

  1. 【项目实战】Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+代码讲解),如需数据+代码+文档+代码讲解可以直接到文章最后获取. 1.项目背景 在衍生产品定价和风险管理中,对当前波动率是很感兴趣的,这是因为需 ...

  2. 基于HASM模型的土壤高精度建模matlab仿真

    欢迎订阅<FPGA学习入门100例教程>.<MATLAB学习入门100例教程> 目录 一.理论基础 二.核心程序 三.测试结果 一.理论基础 土壤有机碳库是陆地生态系统中最丰富 ...

  3. 基于ARCH模型股价波动率建模分析

    原文链接:http://tecdat.cn/?p=3856 引言 金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量.然而,资产波动率的类型有多种.波动率是期权定价和资产分配中得一个 ...

  4. 浅谈R语言基于ARCH模型股价波动率建模

    转载自品略图书馆 http://www.pinlue.com/article/2020/06/2415/4610812779833.html 引言 金融中一个重要度量是与资产相关的风险,而资产波动率是 ...

  5. R语言基于ARCH模型股价波动率建模分析

    引言 金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量.然而,资产波动率的类型有多种.波动率不能直接观测的性质在波动率研究和建模中有非常重要的含义. 数据选取 最近我们被要求撰写关 ...

  6. R语言基于ARCH模型股价波动率建模

    金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量.然而,资产波动率的类型有多种.波动率是期权定价和资产分配中得一个关键颜色.波动率不能直接观测的性质在波动率研究和建模中有非常重要的 ...

  7. 基于SABR模型的期权波动率曲线套利策略

    转自:要资讯 交易逻辑:同一标的物不同行权价.不同期限的期权之间价格差异很大,无法直接比较.通过定价公式将期权市场价格反解得到的隐含波动率,才能够代表期权的真实价值.而受多方面因素影响,由各个行权价构 ...

  8. matlab火箭模型,基于Matlab/Simulink的新型火箭建模与仿真平台搭建

    2018 年 11 月第 14 卷 第 4 期 系 统 仿 真 技 术 System Simulation Technology Nov. ,2018 Vol. 14,No. 4 中图分类号: TP3 ...

  9. 基于LEAP模型的能源环境发展、碳排放建模预测及不确定性分析实践应用

    在国家"3060"碳达峰碳中和的政策背景下,如何寻求经济-能源-环境的平衡有效发展是国家.省份.城市及园区等不同级别经济体的重要课题.根据国家政策.当地能源结构.能源技术发展水平以 ...

  10. 【数学建模】基于SIR模型实现新冠病毒COVID-19估计附matlab代码

    1 内容介绍 COVID-19是由严重急性呼吸综合症冠状病毒2型引发的传染病,它最初病毒携带者是一些动物,传染源主要是COVID-19患者,无症状患者.传播方式主要是呼吸道飞沫近距离传播,接触传播,还 ...

最新文章

  1. java程序无法启动_由于Java程序,Tomcat无法启动
  2. ASP条件语句之IF语句
  3. 三星Galaxy S8得到Daydream支持
  4. [置顶] “河软CSDN2011级表彰暨实习动员大会”顺利召开!
  5. django下创建APP
  6. SAP Analytics Cloud嵌入到SAP Cloud for Customer的效果图
  7. csv 字符串_python3从零学习-5.5.1、CSV 文件读写
  8. 在STM32CubeMX生成的MDK5工程上添加RT-Thread Nano后双击工程名无法打开.map文件的解决方法
  9. 安装mysql后环境变量_环境变量配置2 安装mysql
  10. 《大数据工程师 面经 自己整理 面试题1--》
  11. 软件获取imei和imsi_获取设备信息(imei、imsi、uuid)的调整使用plus.device.getInfo方法的说明...
  12. golang struct数组排序_go语言中排序sort的使用方法示例
  13. C++ Primer Plus_读书笔记_第2章 开始学习C++
  14. 明日之后、“吃鸡”为何成为爆款手游?我们帮你分析了10000条快手广告
  15. 简单的 JSONParser
  16. JDP02-[策略模式]-鸭子模型
  17. ubuntu有怪怪的声音一直跟读屏幕解决方法
  18. 怎样看懂电路板?电路板短路检查方法是什么?
  19. python 因子分析 权重计算方法_【万矿新品】因子研究利器——WindAlpha
  20. 焊锡膏可靠性测试方案

热门文章

  1. 对51job网页招聘信息的简单爬取
  2. PHP即充宝v3.0实例
  3. PeopleSoft开发:创建查询QUERY
  4. 记一次利用tomcat manager部署war包失败并解决的经历
  5. 语法高亮自定义颜色主题配置(Code::Blocks)
  6. 应届生offer指南
  7. drools学习笔记-rule组织方式
  8. STM32的存储器与寄存器
  9. 使用am start命令启动android apk应用程序
  10. python使用 Captcha 模块来生成验证码图片