stata实证分析专题【计量经济系列(三)】

文章目录

  • 1. 数据
  • 2. 有常数项的回归
  • 3. 无常数项的回归
  • 4. 多元回归
  • 5. 对部分满足条件数据做回归
  • 6. predict
  • 7. 系数的检验 test
  • 8. 多元线性回归的古典假定
  • 9. 练习

    ʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞʚʕ̯•͡˔•̯᷅ʔɞ
                 


          


1. 数据

use grilic,clear
list s lnw in 1/10

                     

2. 有常数项的回归

reg lnw s

        
其中
SS中Model 表示可以被模型解释的平方和(回归解释平方和),即ESS。
SS 中 Residual 表示残差平方和(未解释平方和),即RSS。

df表示自由度

MS表示单位自由度的平方和,MS=SSdf\displaystyle MS=\frac{SS}{df}MS=dfSS​,MS可以用来反映数据的变动趋势,对回归分析有一定参考价值 。


Number of obs 表示观测值(数据)的个数

F(1, 756)表示 检验整个方程显著性的F 统计量,即F(k−1,n−k)F(k-1,n-k)F(k−1,n−k)的值,这个在多元回归中更具有研究意义,但是这里还是要先讲一下:
其中k是2,表示有一个常数项,一个自变量的自由度之和为2。
k-1表示减去常数项的自由度。n是758,即758个样本数据的自由度。
将F值与临界值Fα(k−1,n−k)F_{\alpha}(k-1,n-k)Fα​(k−1,n−k)的大小比较,
在5%的置信水平下,因为n-k大于了120,则视为无穷大,即Fα(1,∞)F_{\alpha}(1,\infty)Fα​(1,∞)值为3.84,F(1, 756)值为255.7,远大于它,则应拒绝原假设N0N_0N0​:β_1=β_2=…=0(即模型联合不显著)。表明模型是联合显著的。


在使用stata等工具时,相比F值,更常用的是P值。

Prob>F 即P值,
在此例中,
P值为0,即在0.1、0.05、0.02、0.01的显著性水平下,P值都小于他们,也可以得出拒绝原假设的结论,即模型是联合显著的。


R-squared即R2R^2R2,可决系数,或拟合优度。
Adj R-squared 即修正可决系数

 R‾2=1−∑ei2/(n−k)∑(Yi−Y‾)2/(n−1)=1−n−1n−k∑ei2∑(Yi−Y‾)2\overline{R}^2=1-\frac{\sum{e_i^2}/(n-k)}{\sum{(Y_i-\overline{Y})^2}/(n-1)}=1-\frac{n-1}{n-k}\frac{\sum{e_i^2}}{\sum{(Y_i-\overline{Y})^2}}R2=1−∑(Yi​−Y)2/(n−1)∑ei2​/(n−k)​=1−n−kn−1​∑(Yi​−Y)2∑ei2​​


Root MSE是均方根误差,也叫方程的标准偏差 或 方程的标准误差。
其不同于标准差

标准差是用来衡量一组数自身的离散程度,而均方根误差是用来衡量观测值同真值之间的偏差,它们的研究对象和研究目的不同,但是计算过程类似。

计算公式为
Root MSE =di2n\displaystyle = \sqrt{\frac{di^2}{n}}=ndi2​​ =(yi​−yi^)​2n\displaystyle=\sqrt{\frac{{(y_i​−\hat{y_i})​}^2}{n}}=n(yi​​−yi​^​)​2​​

其中yiy_iyi​是真实值,yi^\hat{y_i}yi​^​是拟合值。而是方差和标准差中则是真实值减去均值进行计算的。


"Coef."表示回归系数(Coefficient),
"_cons"表示常数项(constant)

所以此处得到的回归线为:

                 ln⁡w^=4.391+0.097s\displaystyle \hat{\ln{w}}=4.391 + 0.097slnw^=4.391+0.097s

t表示T统计量的值,可以与临界值相比较。
P>|t| 即P值。将其与目标显著性水平相比较,具体不再赘述。

[95% Conf. Interval]则表示置信水平为95%的置信区间。


绘制散点图与回归线

twoway (scatter lnw s)(lfit lnw s)

      


3. 无常数项的回归

少数情形,我们希望在做回归的时候施加一定的约束,即x=0时y=0,即截距为零。比如对于一对密度不尽相同的石头,当其体积为0时,质量一定也为0。

noc全称为noconstant

reg lnw s,noc

        
上边解释得太详细了,这里的输出结果就不再一一解释了。

两次计算R2R^2R2的公式是不相同的,
如果使用原来的公式计算没有常数项的方程R2R^2R2,即

        1−∑i=1n(yi−β1xi)2∑i=1n(yi−y‾)2\displaystyle 1-\frac{\sum_{i=1}^{n}{(y_i-\beta_1x_i)^2}}{\sum_{i=1}^{n}{(y_i-\overline{y})^2}}1−∑i=1n​(yi​−y​)2∑i=1n​(yi​−β1​xi​)2​

则计算结果为负值。

这里的的R2R^2R2是由新的公式:

        1−∑i=1n(yi−β1xi)2∑i=1nyi2\displaystyle 1-\frac{\sum_{i=1}^{n}{(y_i-\beta_1x_i)^2}}{\sum_{i=1}^{n}{y_i^2}}1−∑i=1n​yi2​∑i=1n​(yi​−β1​xi​)2​

计算出的。

通过两次回归,可以看到前者仅有0.2527,而后者高达0.9798。无常数项的R2R^2R2和有常数项的R2R^2R2之间是不可比的。
在合适的情形下选择不具有常数项的模型,会更具有经济意义。

而且,无常数项的回归结果得到的系数0.4154作为投资回报率,明显是不合理的。
而从有常数项的回归结果中,可以看到常数项的P值为0,说明拒绝原假设,常数项是显著不为0的,也说明此模型的选择应该有常数项。


4. 多元回归

reg lnw s expr tenure smsa rns

        
图表读法同上文所述。

回归系数协方差矩阵 vce

vce指的是 variance covariance matrix estimated
使用命令vce可以实现显示回归系数的协方差矩阵。
其对上一次回归命令的回归结果进行操作,而不需要指定参数。

vce

        


5. 对部分满足条件数据做回归

其中rns有0和1两种取值,0表示北方,1表示南方,
如果只对南方居民样本进行回归

reg lnw s expr tenure smsa if rns

        


反之,只对北方居民做回归,则使用波浪线符号 ~ 表示逻辑否:

reg lnw s expr tenure smsa if ~rns

        


对变量s大于等于12且rns为1的数据,且不要常数项:

reg lnw s expr tenure smsa if rns & s>=12,noc

        


6. predict

使用predict求被解释变量的拟合值,并生成一列新的变量lnw1

use grilic,clear
quietly reg lnw s expr tenure smsa rns
predict lnw1

其中在命令前加quietly命令,可以使命令悄无声息地执行,而不汇报结果。
使用predict前需要先做回归。
生成的新变量lnw1如图所示,即为被解释变量的拟合值。


使用predict求计算残差,并生成一列新的变量e

use grilic,clear
quietly reg lnw s expr tenure smsa rns
predict e,residual


7. 系数的检验 test

使用test命令可以实现对回归系数的检验

还使用grillic数据,
检验教育投资回报率是否为0.1
原假设H0H_0H0​即为:β2=0.1\displaystyle \beta_2=0.1β2​=0.1:

use grilic,clear
quietly reg lnw s expr tenure smsa rns
test s=0.1

命令执行效果如下:
                
这里汇报看F统计量的值和P值。
由P值等于0.6515过大,故这里无法拒绝原假设。


8. 多元线性回归的古典假定

         yi=β1+β2xi2+...+βkxik+ϵi\displaystyle y_i =\beta1+\beta2 x_{i2}+...+\beta k x_{ik} +\epsilon_iyi​=β1+β2xi2​+...+βkxik​+ϵi​  (i=1,...,n)(i=1,...,n)(i=1,...,n)


①零均值假定

即 严格外生性(strict exogeneity),随机扰动项的条件期望为0。
此假定要求E(ϵi∣X)=E(ϵi∣x1,...,xn)=0\displaystyle E(\epsilon_i|X)=E(\epsilon_i|x1,...,x_n)=0E(ϵi​∣X)=E(ϵi​∣x1,...,xn​)=0   (i=1,...,n)(i=1,...,n)(i=1,...,n)
严格外生性意味着,给定数据矩阵XXX,扰动项ϵi\epsilon_iϵi​的条件期望为0。


②球形扰动项
即随机扰动项满足同方差、无自相关。
Cov(ui,uk)=\displaystyle Cov(u_i,u_k)=Cov(ui​,uk​)=

E[(ui−Eui)(uk−Euk)]\displaystyle E[(u_i-Eu_i)(u_k-Eu_k)]E[(ui​−Eui​)(uk​−Euk​)]

=E(uiuk)={σ2,i=k0,i≠k(i,k=1,2,...n)\displaystyle =E(u_iu_k)=\left\{ \begin{aligned} \sigma^2 ,i = k \\ 0 ,i ≠k \\ \end{aligned} \right.(i,k=1,2,...n)=E(ui​uk​)={σ2,i=k0,i​=k​(i,k=1,2,...n)

随机扰动项的方差-协方差矩阵为

VAR(U)=[σ20...00σ2...0.........00...σ2]=σ2In\displaystyle =\left[ \begin{matrix} \sigma^2 & 0 & ... & 0 \\ 0 & \sigma^2 & ... & 0 \\ ... & ... & & ... \\ 0 & 0 & ... & \sigma^2 \\ \end{matrix} \right]=\sigma^2I_n=⎣⎢⎢⎡​σ20...0​0σ2...0​.........​00...σ2​⎦⎥⎥⎤​=σ2In​


③随机扰动项与解释变量不相关假定
Cov(Xji,ui)=0Cov(X_{ji},u_i)=0Cov(Xji​,ui​)=0       (j=2,3,...,k;i=1,2,...,n)(j=2,3,...,k;i=1,2,...,n)(j=2,3,...,k;i=1,2,...,n)


④无多重共线性假定
不存在“严格多重共线性”
即数据矩阵XXX满列秩。
即数据矩阵各列向量线性无关,不存在哪个解释变量是另一个解释变量的倍数,或者说可以被其他解释变量线性表示的情况。


⑤正态性假定
随机扰动项uiu_iui​服从正态分布
uiu_iui​~N(0,σ2)N(0,σ^2)N(0,σ2)


9. 练习

数据集 airq. dta包含1972年美国加州30个大城市的如下变量:airq(空气质量指数,越低越好) , vala(公司的增加值,千美元) , rain(降雨量,英寸) , coast(是否为海岸城市) , den-sity(人口密度,每平方英里) , income(人均收入,美元)。
(1)把airq对其他变量进行OLS回归。
(2)检验原假设“平均收入对空气质量没有影响”。
(3)检验经济变量density 与 income的联合显著性。
(4)检验环境变量rain 与coast的联合显著性。
(5)检验所有解释变量的联合显著性。

use airq,clear

(1)

reg airq vala rain coast density income

         

(2)

test income=0

                

(3)

test density income

                

(4)

test rain coast

                

(5)

test vala rain coast density income

                


本次分享就到这里,小啾感谢您的关注与支持!

stata回归分析与系数检验专题【计量经济系列(三)】相关推荐

  1. 工具变量法案例【计量经济系列(八)】

    stata 工具变量法案例[计量经济系列(八)] 文章目录 1.数据集 2. 初步回归,发现内生变量 3. 使用工具变量,2SLS回归 4. 检验外生性,过度识别检验 5. 检验 工具变量与内生变量 ...

  2. stata 模型设定专题【计量经济系列(六)】(遗漏变量、无关变量、多重共线性、leverage、虚拟变量、线性插值......)

    stata 模型设定专题[计量经济系列(六)] 文章目录 1. 遗漏变量 与 无关变量 1.1 遗漏变量 1.2无关变量 2. 解释变量的权衡标准 3. 检验函数形式 4. 多重共线性 4.1 检验多 ...

  3. stata 异方差专题【计量经济系列(四)】

    stata 异方差专题[计量经济系列(四)] 文章目录 1. 异方差检验方法 2. 散点图法 3. BP检验 4. 怀特检验 5. FWLS 可行权的最小二乘法 6. 小练习     ʚʕ̯•͡˔•̯ ...

  4. stata 工具变量法【计量经济系列(七)】

    stata 工具变量法[计量经济系列(七)] 文章目录 1. 内生性 2. 工具变量 3. 2SLS (二阶段最小二乘法) 4. 弱工具变量 5. 工具变量外生性的过度识别检验 6. 豪斯曼检验 6. ...

  5. Stata常用命令集锦【计量经济系列(一)】

      Stata常用命令集锦[计量经济系列(一)] 文章目录 1.数据集的打开.关闭与保存 1.1 导入Excel数据 1.2 打开dta数据 1.3 关闭数据集 1.4 保存数据 2.stata运算符 ...

  6. stata面板数据单位根检验llc_STATA计量研究/面板单位根检验分析(含代码)

    整理人:郑铿城 在stata建模过程中,严格上来说,在面板数据处理好后,建模步骤的第一步应该就是面板单位根检验,因为平稳数据与非平稳数据建模步骤差异较大,若直接对非平稳数据建模,易出现伪回归现象.面板 ...

  7. 第二届Stata中国用户大会暨“计量经济方法及应用研讨会”会议通知

    会议背景: 2018年"第二届Stata中国用户大会"(2018China Stata Users' Conference)是由北京友万信息科技有限公司(简称:友万科技)主办,顺德 ...

  8. 26篇计量经济经典论文复现数据和Stata或R代码

    26篇文章的复现数据.Stata或R复制程序.各位学者可以阅读这些文章,并根据Stata和R代码对原文中的图表进行一一复制,只有这样才能成长更快. 以其中一篇文章为例,包含了以下内容: [26篇论文目 ...

  9. Stata: 面板 Granger 因果检验

      作者:李珍 (厦门大学) Stata 连享会: 知乎 | 简书 | 码云 | CSDN Source: Luciano Lopez, Sylvain Weber, 2017, Testing fo ...

  10. cif t t操作流程图_Danish:STATA 操作正态检验、卡方检验和T检验

    STATA 操作正态检验.卡方检验和T检验 图示和基本概念 Coef. :回归分析系数.在回归方程中表示自变量x 对因变量y 影响大小的参数.回归系数越大表示x 对y 影响越大. Std. Err.  ...

最新文章

  1. mysql a-z排序_mysql实现首字母从A-Z排序
  2. 2018年视觉所有干货博文的分类汇总
  3. stm32_CAN总线知识
  4. MySQL基础之控制台常用命令
  5. Yii框架特点及测试考虑
  6. AngularJS 项目搭建--基于RequireJs
  7. C4D插件:Springy for Mac 动​​画对象添加重叠动作插件
  8. Acwing 240食物链(带权并查集)
  9. 毕业设计10-22星期日
  10. 微课|中学生可以这样学Python(6.3节):变量作用域
  11. dubbo2.6源码-负载均衡
  12. C# CookieHelper帮助类
  13. pytest框架+conftest.py配置公共数据的准备和清理
  14. RH413-测试文件的特殊权限
  15. 转: 在CentOS 6.X 上面安装 Python 2.7.X
  16. Nginx反向代理、静态资源下载
  17. 吴恩达机器学习python实现8 异常检测及推荐系统
  18. vue-symbol
  19. 前端小白仿写小米官网首页(静态页面+jquery轮播图)
  20. 机器学习-sklearn第十二天——笔记

热门文章

  1. 杭州证历本如何使用_药店也可以用
  2. 微信电脑版多用户登录
  3. pandas精华总结
  4. execute immediate使用方法
  5. 11.2.1 绝对值函数
  6. Banner本地图片轮播图
  7. 拼多多增长黑客模式实战
  8. 计算机培训后的感言,计算机中级培训感言
  9. CSS3动画(动画已丢,看原文)
  10. VLAN划分-思科模拟器-基础回顾