两阶段最小二乘回归(2sls回归)是解决内生性问题的常用方法。上文中对两阶段最小二乘法做了基本介绍(SPSSAU:一文读懂内生性问题之两阶段最小二乘法TSLS),本文将通过案例说明具体操作步骤。

1 背景

本案例引入Mincer(1958)关于工资与受教育年限研究的数据。案例数据中包括以下信息,如下表格:

数据共有12项,其中编号为1,5,7,8,12共五项并不在考虑范畴。

本案例研究‘受教育年限’对于‘Ln工资’的影响。明显的,从理论上可能出现‘双向因果关系’即‘受教育年限’很可能是内生变量。那么可考虑使用‘母亲受教育年限’和‘成绩’这两项数据作为工具变量。同时研究时纳入3个外生变量,分别是‘婚姻’,‘是否大城市‘和’当前单位工作年限’。使用两阶段最小二乘TSLS回归进行解决内生性问题。

本案例研究时,工具变量为2个,内生变量为1个,因而为过度识别,可以正常进行TSLS回归。

2 理论

两阶段最小二乘回归,其内部原理上共分为两次回归。第一次回归将内生变量与工具变量,外生变量进行回归,并且得到回归预测值Prediction;第二次回归将被解释变量与Prediction,外生变量进行回归,得到最终模型结果。第一次回归为中间过程值,SPSSAU并没有输出,如果有需要可自行使用线性回归或OLS回归进行即可。

  • 关于内生性的检验Durbin-Wu-Hausman检验,其用于检验是否真的为内生变量;如果说检验不通过(接受原假设),那么说明没有内生变量存在,可直接使用OLS回归即可。当然即使没有内生性,一般也可以使用TSLS回归,没有内生性问题时,OLS回归和TSLS回归结论通常一致;
  • 关于过度识别检验上,SPSSAU提供Sargan检验和Basmann检验(使用任意其一即可),原理上此过度识别检验仅在‘过度识别’时才会输出,即工具变量个数>内生变量个数时,才会输出。

3 操作

本案例分别将被解释变量,内生变量,工具变量和外生变量纳入对应的模型框中,如下:

4 SPSSAU输出结果

SPSSAU共输出6类表格,分别是研究变量类型表格,2sls模型分析结果表格,2sls模型分析结果-简化格式表格,模型汇总(中间过程)表格,Durbin-Wu-Hausman test外生性检验(test of exogeneity)和过度识别检验(overidentifying restrictions)。说明如下:

上一表格展示本次研究时涉及的各变量属性,包括被解释变量,内生变量,工具变量和外生变量组成情况。

上表格列出TSLS两阶段最小二乘回归的最终结果(第二阶段结果),首先模型通过Wald 卡方检验(Wald χ² =244.172,p=0.000<0.05),意味着模型有效。同时R方值为0.342,意味着内生和外生变量对于工资的解释力度为34.2%。具体查看内生和外生变量对于被解释变量‘工资’的影响情况来看:

受教育年限的回归系数值为0.112(p=0.000<0.01),意味着受教育年限会对工资产生显著的正向影响关系。

婚姻(已婚为1)的回归系数值为0.167(p=0.000<0.01),意味着相对未婚群体来讲,已婚群体的工资水平明显会更高。

是否大城市(1为大城市)的回归系数值为0.145(p=0.000<0.01),意味着相对来讲,大城市样本群体,他们的工资水平明显会更高。

当前单位工作年限的回归系数值为0.036(p=0.000<0.01),意味着当前单位工作年限会对工资产生显著的正向影响关系。

总结分析可知:受教育年限, 婚姻,是否大城市, 当前单位工作年限全部均会对工资产生显著的正向影响关系。

上表格展示模型的基础指标值,包括模型有效检验wald卡方值(此处提供wald卡方非F检验),R值,Root MSE等指标值。

Durbin-Wu-Hausman test用于检验解释变量X(即内生外量)是否均为外生变量(即是否不存在内生变量)

从上表可知,本次研究纳入的内生变量为‘受教育年限’,Wu-Hausman检验显示拒绝原假设(p=0.047<0.05),意味着‘所有解释变量均外生’这一假设不成立。即意味着‘受教育年限’是内生变量。同时也可使用Durbin检验,一般情况下使用Durbin-Wu-Hausman检验较多。

特别提示:

如果无法拒绝原假设,那么说明研究的内生变量并不是真正意义上的内生变量,那么此时可考虑直接使用OLS回归结果即可,但多数时候也可直接使用TSLS两阶段最小二乘的结果,似研究者专业理论知识综合而定。

过度识别检验用于检验工具变量是否为外生变量,本次研究涉及工具变量为2个,分别是‘母亲受教育年限’和‘成绩’。从上表可知,过度识别Sargan检验显示接受原假设(p=0.874>0.05),同时Basmann检验也显示接受原假设(p=0.874>0.05)。同说明无法拒绝‘工具变量外生性’这一假定,模型良好。

特别提示:

  • 过度识别检验用于判断‘工具变量的外生性’,SPSSAU提供Sargan和Basmann检验,使用其一即可
  • 工具变量个数>内生变量个数,即过度识别时,才会有效;如果恰好识别(工具变量个数=内生变量个数),此时无法输出检验值。

5 剖析

涉及以下几个关键点,分别如下:

内生变量和外生变量,其二者均为解释变量,如果考虑内生性问题时才会将解释变量区分成内生变量和外生变量。

模型有效性检验上,SPSSAU默认使用wald卡方检验而非F检验。

「更多内容登录SPSSAU官网了解」

两阶段最小二乘法TSLS案例分析相关推荐

  1. R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断

    最近我们被客户要求撰写关于计量经济学的研究报告,包括一些图形和统计输出. 简介 两阶段最小二乘法(2SLS)回归拟合的线性模型是一种常用的工具变量估计方法. 本文的主要内容是将各种标准的回归诊断扩展到 ...

  2. 两阶段最小二乘法原理_R语言代写工具变量与两阶段最小二乘法

    我们要估计的模型是 y=a+bx+cd+ey=a+bx+cd+e, 其中是解释变量,,和是我们想要估计的系数.是控制变量,是治疗变量.我们特别关注我们的治疗效果对. 生成数据 首先,让我们生成数据. ...

  3. 两阶段最小二乘法原理_两阶段最小二乘法.PPT

    估计是逐个方程展开.以EViews附带的工作文件cs.wf为例.工作文件界面为: 其中CS(人均消费).INV(投资)和GDP为内生变量.Gov_net为外生变量. 建立模型如下: cs=c(1)+c ...

  4. R语言工具变量与两阶段最小二乘法

    我们要估计的模型是 其中是解释变量,和是我们想要估计的系数. x是控制变量,d是治疗变量.我们对我们治疗d对y的影响特别感兴趣. 生成数据 首先,让我们生成数据. 假设x,d,z(d的工具变量)和e之 ...

  5. 一文教你Heckman两阶段模型怎么分析

    一.研究背景 在某些情况下,被解释变量Y的取值范围会受到限制,比如研究家庭医疗保险支出的影响因素时,某此家庭没有医疗支出即数字全部为0,也或者研究家庭收入水平时,某些样本家庭完全没有收入那么收入就全部 ...

  6. python预测模型案例_案例2:精准营销的两阶段预测模型1

    案例2:精准营销的两阶段预测模型1案例2:精准营销的两阶段预测模型1 数据集 模型的select查询方法返回数据集对象 think\model\Collection,该对象继承自think\Colle ...

  7. 【系统分析师之路】2008年下系统分析师下午案例分析真题

    [系统分析师之路]2008年下系统分析师下午案例分析真题 系统分析师下午案例分析 [系统分析师之路]2008年下系统分析师下午案例分析真题 系统分析师下午案例分析试题一 系统分析师下午案例分析试题二 ...

  8. php 许愿墙 阶段案例_房地产全周期设计管控流程解析及跨部门合作及案例分析...

    时间:2021年1月22-23日 地点:北京 授课专家:高炜 联系人:文雯 手机微信:13264559187 课程前言 房地产市场虽已进入"白银时代",但中国的城市化过程并没有结束 ...

  9. 计算机两个硬盘无法重启,双硬盘电脑非系统盘硬盘盘符重启丢失的案例分析

    原标题:双硬盘电脑非系统盘硬盘盘符重启丢失的案例分析 昨晚,小编在工作了一段时间之后,重新启动计算机,突然发现两个数据盘分区没了,从计算机的磁盘管理里面看,硬盘分区还在,盘符没了.如下图所示: 我的计 ...

  10. u-boot分析之两阶段代码分析(三)

    目录 u-boot(三)启动文件 1,概述 2,uboot第一阶段代码分析: 汇编 2,uboot第二阶段代码分析 C:_start_armboot C:main_loop u-boot(三)启动文件 ...

最新文章

  1. DNS域名解析优化之tinydns/djbdns篇——测试篇
  2. 首次使用批处理框架 Spring Batch ,被震撼到了,太强大...
  3. 串口通信模块2:串口通信编程基础(打开、配置)
  4. 输入一个天数计算几周零几天 C语言,结构体练习——计算输入的日期为本年度第几天...
  5. odbc mysql server_使用MySQL ODBC进行MySQL和SQL Server转换
  6. linux系统管理Linux系统实验,实验三 linux系统管理.doc
  7. 来自吉普赛人祖传的神奇读心术.它能测算出你的内心感应
  8. SSM实现会议室预约管理系统
  9. Lattice Radiant烧写程序
  10. a标签 vue 动态点击_vue 中a标签如何实现点击赋值
  11. 液晶OLED接口MIPI之DSI协议学习
  12. 为什么需要使用云计算技术?
  13. 漫画 | 30年后,中国就会有自己的编程语言!
  14. 大数据开发的五个步骤
  15. Python 选课系统
  16. 1. 数据可视化简介 笔记
  17. IT职场老油条亲传:教你如何在公司汇报工作时表现更亮眼
  18. eclipse安装JST Server Adapters 和 JST Server Adapters Extentions报错
  19. 苹果Mac系统快捷键 mac新手必看
  20. 扒一扒数据黑色产业链:猖獗内鬼、黑客联盟,你中招了吗?

热门文章

  1. 国内域名国内服务器,不备案解决80端口不开放方法
  2. layui重置按钮函数,支持文件
  3. js监听中文拼音输入开始输入和输入完成的事件,用input事件用拼音输入法的大坑,由这两个事件来解决
  4. 我们应能在哪个层次使用计算机,福师20秋《计算机应用基础》在线作业一题目【标准答案】...
  5. 数据库分页数据丢失问题
  6. 请问大家,有没有法学相关的毕业论文选题 ?
  7. Tasking编译器开发TC275(Tricore)中使用自定义段
  8. 计算机网络介绍,TCP协议,Socket网络编程
  9. hexo+next主题优化之加入网易云音乐、网易云跟帖、炫酷动态背景
  10. SIFI和ORB在尺度缩放、旋转、仿射上的特征点不变实验代码,并比较SIFI和ORB提取特征点的速度