原文链接:http://tecdat.cn/?p=6274

原文出处:拓端数据部落公众号

在这篇文章中,我们将看看如何在实践中使用R  。为了说明,我们首先从线性回归模型中模拟一些简单数据,其中残差方差随着协变量的增加而急剧增加:

 n < -  100
x < -  rnorm(n)
residual_sd < -  exp(x)
y < -  2 * x + residual_sd * rnorm(n)

该代码从给定X的线性回归模型生成Y,具有真正的截距0和真实斜率2.然而,残差标准差已经生成为exp(x),使得残差方差随着X的增加而增加。可以直观地看到这个效果:

 

这使

模拟Y对X数据的图,其中残差方差随着X的增加而增加

在这个简单的情况下,视觉上清楚的是,对于较大的X值,残差方差要大得多,因此违反了“基于模型”的标准误差所需的关键假设之一。无论如何,如果我们像往常一样拟合线性回归模型,让我们看看结果是什么:

> summary(mod)lm(formula = y~x)最小1Q中位数3Q最大值
-25.9503 -0.8574 -0.1751 0.9809 13.4015 系数:估计标准。误差t值Pr(> | t |)
(截距)-0.08757 0.36229 -0.242 0.809508
x 1.18069 0.31071 3.800 0.000251 ***
---
Signif。代码:0'***'0.001'**'0.01'*'0.05'。' 0.1 '' 1 残余标准误差:3.605 98上的自由度的
多R平方:0.1284,调整R平方:0.1195
F统计:14.44 1和98 DF,p值:0.0002512

这表明我们有强有力的证据反对Y和X独立的零假设。为了便于比较,我们注意到X效果的标准误差是0.311。

接下来,我 然后将先前安装的lm对象传递给包中​​的函数,该函数计算 方差估计值:

> vcovHC(mod,type =“HC”)(
截距)x (截距)0.08824454 0.1465642
x 0.14656421 0.3414185

得到的矩阵是两个模型参数的估计方差协方差矩阵。因此,对角线元素是估计的方差(平方标准误差)。因此,我们可以通过采用这些对角元素和平方根来计算夹心标准误差:

 > sandwich_se
(Intercept)x 0.2970598 0.5843103

因此,X系数的 标准误差为0.584。这与先前基于模型的标准误差0.311形成对比。因为此处残差方差不是恒定的,所以基于模型的标准误差低估了估计的可变性,并且夹心标准误差对此进行了校正。让我们看看它对置信区间和p值有何影响。为此,我们使用估计量渐近(在大样本中)正态分布的结果。首先,要获得置信区间限制,我们可以使用:

> coef(mod)-1.96 * sandwich_se
(
截距)x -0.66980780 0.03544496
> coef(mod)+ 1.96 * sandwich_se
(截距)x 0.4946667 2.3259412

因此,X系数的95%置信区间限制为(0.035,2.326)。为了找到p值,我们可以首先计算z-统计量(系数除以它们相应的标准误差),并将平方z-统计量与一个自由度上的卡方分布进行比较:

 > p_values < -  pchisq(z_stat ^ 2,1,lower.tail = FALSE)
> p_values
(截距)x 0.76815365 0.04331485

我们现在有一个p值表示Y对X的依赖性为0.043,而早期从lm为0.00025得到的p值。

拓端tecdat|R语言用于线性回归的稳健方差估计相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  3. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  4. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  5. R语言使用线性回归模型来预测(predict)单个样本的目标值(响应值、response)实战

    R语言使用线性回归模型来预测(predict)单个样本的目标值(响应值.response)实战 目录

  6. R语言基于线性回归(Linear Regression)进行特征筛选(feature selection)

    R语言基于线性回归(Linear Regression)进行特征筛选(feature selection) 对一个学习任务来说,给定属性集,有些属性很有用,另一些则可能没什么用.这里的属性即称为&qu ...

  7. R语言进行线性回归的拟合度

    R语言进行线性回归的拟合度. 本文只是使用 R做回归计算,查看拟合度等,不讨论 R 函数的内部公式 在R中线性回归分析的函数是lm(),基本语法是 一元回归: lm(y ~ x,data) 多元回归: ...

  8. 拓端tecdat荣获掘金社区入驻新人奖

    2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...

  9. R语言计算线性回归的最小二乘估计

    R语言计算线性回归的最小二乘估计 全称:线性回归的最小二乘法(OLS回归),ordinary least square,字面翻译:普通最小平方: 内容:包括三个部分:简单线性回归.多项式回归.多元线性 ...

  10. 基于R语言一元线性回归模型实例及代码

    基于R语言一元线性回归模型实例及代码 题目描述 数据特征及可视化 建立模型与初步评价 (自己写lm()代码) 显著性检验 整体显著性检验 数学理论 系数显著性检验 代码实现系统显著性检验 回归诊断 异 ...

最新文章

  1. 【Java】练习题:数字判断
  2. Python整型数与字符串相互转换
  3. mac中安装activeMQ
  4. LeetCode 807. 保持城市天际线
  5. 编程建立一通讯簿C语言,C语言编程问题用C语言编个学生通讯录管理系统,功能有:①创建通讯 爱问知识人...
  6. python selenium 小知识点整理笔记(更新中...)
  7. 数据分析 | 将业务问题转换为统计问题后,我看到了数字的真相
  8. 低版本 android 软件下载,纳米盒旧版本下载-纳米盒旧版下载4.1安卓版-西西软件下载...
  9. 一、全国计算机三级数据库考试——理论知识总结(选择题)
  10. 计算机病毒教学评课,计算机病毒评课稿样稿.doc
  11. 华为ENSP配置VLAN间路由
  12. Jenkins下载,部署,基本使用(SVN版)
  13. 银行半结构化面试题目汇总
  14. bzoj 4238: 电压 dfs树
  15. exsi rh2288hv5 驱动_华为服务器RH2288H V3 引导ServiceCD安装Windows系统方
  16. 顺丰笔试-赏金猎人2020-08-20(参考时间最大利益)
  17. M1芯片处理器mac能用的AI(llustrator CC 2021 直装版M1优化版)解决M1版MAC安装AI闪退问题 完美支持M1芯片处理器
  18. 【Android】虚拟环绕声
  19. 如何删除在Excel中存在的无效的链接呢
  20. 干货|TDD落地:从僵化、优化到固化的过程

热门文章

  1. centos6.5里用yum简单安装配置lamp
  2. 控制按键的 几种方法
  3. xFire入门(eclipse、tomcat环境)
  4. 1-22 在“终端”里,运行“top”命令
  5. pytorch autograd.grad
  6. 三、地址族与数据序列
  7. 汇编程序基本结构+利用DOS系统编译连接汇编程序
  8. 【77.39%】【codeforces 734A】Anton and Danik
  9. 基于16QAM调制的OFDM系统仿真实现(MATLAB)
  10. python2.7.7笔记if in