stata学习笔记|异方差问题
异方差无法用OLS进行估计的根源问题:方差较大的数据包含的信息量较小,但OLS是对所有数据进行相同的处理。异方差的问题并不会影响估计量的无偏性、一致性、渐近正态性,只是效率较低使得t检验和F检验失效。
说白了就是回归出来的系数不会改变,只是可能会导致显著性的结果不准确。
而选用GLS以及WLS进行回归可以对不同特征的数据进行不同的处理以提高估计效率。
理论知识
- 异方差的检验
残差图、怀特检验、BP检验
- 异方差的处理
- OLS+标准误(robust)的方式
- 广义最小二乘法(GLS)(相比于上一种方法更为有效):广义最小而成的中心思想就是将模型进行变量转换,进而使得扰动项满足假定。
- 加权最小二乘法(WLS):是GLS的特例
- 可行广义最小二乘法(FGLS):GLS和WLS的问题在于,在运算中是已知总体的扰动项的协方差矩阵的,但事实上这很难实现,故FGLS则可以根据样本数据估计协方差矩阵。
- 如何选择处理方法
在实际运用中,主要是在OLS+标准误与FGLS之间选择,FGLS的最大前提就是对协方差矩阵的一致估计是准确的,但是如果并不准确,则从一开始就是错误的,进而导致不正确的统计推断。而OLS+标准误的方法对回归系数以及标准误的估计都是一致的,对协方差的估计是否准确并无要求。故在一般情况下,仍然选择更为稳健的OLS+标准误方法,而不是FGLS,但在协方差矩阵估计正确的条件下,显然是FGLS更为有效。
Stata操作
- 异方差的检验(均需要先进行回归)
1、残差图
观察时看是否出现残差值是否在一个数值附近,如下图能够明显看出残差在纵轴上的数值波动较大
///残差与拟合值
rvfplot
///残差与某个变量
rvpplot varname
2、怀特检验
看表格上面的Prob>chi2的p值为0.000,故拒绝同方差的假设,即存在异方差问题。
estat imtest,white
3、BP检验
观察p值如果小于0.01,则表示强烈拒绝原假设,即方差不同
///使用拟合值y进行检验
estat hettest
///使用所有解释变量
estat hettest,rhs
///使用个别指定解释变量
estat hettest [varlist]
///前面的BP检验自身是以扰动项服从正态分布为假定前提的,后可放宽至独立同分布(iid)
///(该方法较为常用)
estat hettest,iid
estat hettest,rhs iid
estat hettest [varlist],iid
- WLS(需要经过一系列的计算得到方差的估计值)
可直接保留至do文件
///qui 表示不显示结果,因为我们并不需要这个回归结果
qui reg y x
///计算残差,res是residual的简称,即预测残差
predict e1,res
///因为残差是标准差,需要进行平方得到方差
g e2=e1^2
///取对数进行辅助回归,noc表示不显示常数项
///在此次回归中,可以通过R方的大小判断x解释方差变动的比例,进而进一步判断是否存在方差随着解释变量变动而变动的现象
g lne2=log(e2)
reg lne2 x,noc
///计算回归后拟合出来的方差项,此处predict 默认得到拟合值,并后面接的新变量名默认为你拟合值的变量名
predict lne2f
///去除对数化
g e2f=exp(lne2f)
///最终进行WLS回归
reg y x [aw=1/e2f]
stata学习笔记|异方差问题相关推荐
- STATA 学习笔记 :相关系数
STATA 学习笔记 :相关系数 为什么要计算变量之间的相关系数? 检测变量之间的多重共线性 相关系数呈现的几种方法 1. 散点图矩阵 help graph matrix Description: g ...
- STATA学习笔记:数据合并
STATA学习笔记:数据合并 一 横向合并数据:merge 1. One-to-one merge on specified key variables merge 1:1 varlist using ...
- STATA学习笔记:egen函数
STATA学习笔记:egen函数 1. egen (1)mean() webuse egenxmpl,clear egen avg = mean(cholesterol) gen deviation ...
- STATA学习笔记:外部命令
STATA学习笔记:外部命令 1.设置外部命令存储地址 //在电脑里设置好文件夹以备存储外部命令 //Set location where packages will be installed //方 ...
- STATA学习笔记:缺漏值的处理
STATA学习笔记:缺漏值的处理 1. 缺漏值的标记 stata中缺漏值默认标记为"." "."是数值,且是一个大于任何自然数的数值 [注意] sum.gene ...
- STATA学习笔记: do-file
STATA学习笔记: do-file 1.注释 *注释句 /* 注释句*/ //注释句 2. 断行 将一条语句分行书写,避免语句过长不好阅读 (1) :/// sysuse auto, clear t ...
- STATA学习笔记:分组统计和分组回归
STATA学习笔记:分组统计和分组回归 1. 分组统计 (1)对一个类别变量进行统计时 tabulate命令 tabulate oneway //for one-way tables of frequ ...
- stata学习笔记|离散被解释变量
离散被解释变量 二值选择型--二值选择模型 多值选择型--多项选择模型.条件选择.混合 排序数据--排序模型 非负整数计数型--泊松.负二项 二值选择型 采用logit和probit模型(probit ...
- stata学习笔记|OLS回归
大样本OLS的假定 线性假定 yx是渐进独立的平稳过程 所有解释变量为前定的,即与同期扰动项正交 秩条件 无需严格的外生性和正态随机扰动项 回归命令 r表示稳健标准误,其并不改变回归系数,只改变各个解 ...
最新文章
- 2018网站信息系统安全等级保护限期整改通知书的处理解决方案
- 解决phoenix中创建的表名及字段默认是大写的问题
- linux环境下c回车,linux_C 让 getchar()不再需要回车
- qt oracle bindvalue,Qt Sql bindValue与%
- 泛型算法STL中的迭代器,泛型算法,萃取机的一个实现案例
- 关于editor网页编辑器ueditor.config.js 配置图片上传
- another mysql daemon_MySQL错误Another MySQL daemon already running with the same unix socket.
- Python编程基础 - 使用临时文件和临时目录
- linux ghost dd,在Linux上用dd命令实现ghost功能
- Atitit. 解决80端口 System 占用pid 4,,找到拉个程序或者服务占用http 80服务
- 犀牛6.0grasshopper翻译插件_Rhino 6.0犀牛三维建模 软件下载安装包教程(附下载方法)...
- python 端口扫描_Python实现的端口扫描功能
- 04 高等数学专题——向量代数和空间解析几何
- 英雄联盟官网服务器状态查询,官方新功能:各大区服务器状态可查询!
- 01.【设计模式】工厂模式
- excel两个表格数据对比_excel如何1秒钟合并两个不同表格数据?收下这个方法吧...
- 基于原生Wine6.0.2稳定版打补丁解决ukylin-wine图标显示异常和deepin-wine闪退的问题,Ubuntu运行QQ接近完美(附补丁)。
- 播放音乐的html代码,音乐播放器-html代码
- Lucene实现全文检索
- Mac下Qt for android 环境配置