多重共线性

------主要参考何晓群《应用回归分析》
------仅用于个人学习知识整理和R语言代码整理
------看到本站的另一篇总结多重共线性文章,觉得不错,附上链接:多重共线性的产生原因、判别、检验、解决方法


1.定义

若:

则称自变量间存在完全多重共线性


2.影响

  1. 估计值方差变大
  2. 回归系数置信区间变宽,影响估计精度
  3. 一些系数无法通过显著性检验
  4. 回归系数的正负号可能出错

3.诊断

另外找到一个比较详细的诊断方法的列举:线性回归多重共线性的诊断方法和R语言实现

  1. 方差扩大因子法
    ###理论来自于何晓群书本上

R语言实现
###数据来自何晓群书本p150例5.6

y<c(172.9,352.94,447.67,404.02,409.51,619.71,1121.17,1506.94,1105.79,933.03,1008.54,1567.56,1960.06,2884.88,2556.72)
x1<c(11246,10335,13156,6127,27419,25633,95684,105987,46230,37165,48787,75808,123128,371406,198569)
x2<-c(681,791,607,714,911,1231,2760,2651,2105,3030,2810,2649,3031,3644,3690)
x3<c(105.9,107.4,114.4,110.8,99.4,91.4,90.8,86.3,125.3,107.4,106.6,115.7,110.1,105.8,101.6)
x4<c(10183,10414,13134,15033,17389,21715,27075,31827,35393,38823,46079,47871,54372,65602,74917)
x5<c(4110,3996,4689,6876,8636,12339,16623,19937,24787,25112,24414,22970,24403,30531,37861)
x6<c(11242,12693,16681,22131,31353,43528,70752,125989,99468,82478,54936,87135,129884,153044,215033)
x7<-c(9,6.5,6,4.75,4.75,9.5,10,16,10.5,10.5,8.5,6,6.5,5,5.25)
data<-as.data.frame(cbind(y,x1,x2,x3,x4,x5,x6,x7))
reg<-lm(y~.,data=data)
#计算方差扩大因子VIF
#install.packages("car")
library(car)
vif(reg)#方差扩大因子

###这里有一个疑问:老师给的例子其实是没有标准化数据的,那vif计算的时候会自动标准化吗?还是说不需要标准化?

得到结果:

当VIF大于等于10时,说明自变量x可能和其他自变量有多重共线性,这里的x2,x4,x5,x6可能导致多重共线性

  1. 特征根判别法
    ###理论来自于何晓群书本上
    有多少个特征根接近0,设计矩阵X就有多少个多重共线性关系

  2. 条件数

###理论来自于何晓群书本上

当k属于(0,10)时,认为X没有多重共线性
当k属于[10,100)时,存在较强的多重共线性
当k大于等于100时,存在严重的多重共线性

x0<-rep(1,length(x1))
X<-cbind(x0,x1,x2,x3,x4,x5,x6,x7)
XX<-t(X)%*%X
MX<-X
for (i in 1:8)  MX[,i]<-X[,i]/sqrt(XX[i,i])
MX2<-t(MX)%*%MX
ci<-sqrt(kappa(MX2,exact=T))#求条件数max
ei<-eigen(MX2)#求特征根和特征向量
##########
max(ei$values)
k<-numeric()
for (i in 1:8) k[i]<-max(ei$values)/(ei$values[i])
sqrt(k)

可以得到最大的条件数为60.31679,所以存在较强的多重共线性

  1. 直观判定法
    1.增加或删除一个自变量,或改变一个观测值,回归系数的估计值有较大变化
    2.一些重要的变量没有通过显著性检验
    3.有些自变量的系数正负号与定性分析结果相违背
    4.自变量的相关矩阵中,自变量间的相关系数较大
    5.一些重要的自变量的回归系数的标准误差较大

4.解决办法

  1. 剔除一些不显著的变量

  2. 增大样本量

  3. 回归系数的有偏估计
    如岭回归,主成分法,偏最小二乘法等,后续会继续整理

统计分析---多重共线性相关推荐

  1. 数值分析 pdf_统计分析前,要做哪些数据准备工作?

    作者:高乐:审稿:龚志忠,张耀文 提到数据分析,首先会想到的可能是t检验.回归分析等各种具体的分析方法,但对于经历过完整数据分析的同学来说,最复杂.最耗费时间的步骤往往是数据的清理,也就是将数据整理成 ...

  2. 多选题spss相关分析_【医学问卷分析】使用SPSS多重响应对医学问卷多选题进行统计分析——【杏花开医学统计】...

    杏花开生物医药统计 一号在手,统计无忧! 关 注 [医学问卷分析] 使用SPSS多重响应对 医学问卷多选题进行统计分析 关键词:SPSS.问卷分析 导  读 前几期,我们介绍了量表的制作及信效度分析的 ...

  3. 多重共线性问题的几种解决方法

    在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,--,Xk中的任何一个都不能是其他解释变量的线性组合.如果违背这一假定,即线性回归模型 ...

  4. 多元线性回归模型中多重共线性问题处理方法

    转载自:http://datakung.com/?p=46 多重共线性指自变量问存在线性相关关系,即一个自变量可以用其他一个或几个自变量的线性表达式进行表示.若存在多重共线性,计算自变量的偏回归系数β ...

  5. python 多元线性回归_多元统计分析之多元线性回归的R语言实现

    多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...

  6. SPSS常用的10种统计分析

    目录 实验一  地理数据的统计处理 一.实验目的 二.实验内容 三.实验步骤 实验二  双变量相关分析 一.实验目的 二.实验内容 三.实验步骤 实验三 主成分分析 一.实验目的 二.实验内容 三.实 ...

  7. SPASS多元统计分析在无人机航线精度方面的综合评价

    SPASS多元统计分析在无人机航线精度方面的综合评价 无人机作为获取低空航空影像的载体,其航线飞行精度直接决定影像的质量与后期图像数据处理精度.GPS/IMU系统作为无人机目标航点及任务航点导航与定位 ...

  8. 《多元统计分析》学习笔记之判别分析

    鄙人学习笔记 文章目录 判别分析 判别分析的基本思想 距离判别 两总体情况 多总体情况 贝叶斯判别 费歇判别 逐步判别 判别分析 本章介绍的判别分析适用于被解释变量是非度量变量的情形.在这种情况下,人 ...

  9. 多重共线性的影响、判定及消除的方法

    目录 1 什么是多重共线性? 2 多重共线性的影响 3 共线性的判别指标(方差膨胀因子) 3.1 拟合优度 3.2 方差膨胀因子VIF 4 多重共线性处理方法 4.1 手动移除出共线性的变量 4.2 ...

最新文章

  1. sh计算机,计算机教程:shellII(sh).pdf
  2. SAP最佳业务实践:重复制造(149)-4发料
  3. 嵌入式linux root免密码,给嵌入式linux串口添加密码的一些总结
  4. 前端---JavaScript基础1
  5. 第八十五期:一文彻底搞懂cookie和session
  6. android 获取cpu型号_当贝投影带你认识投影仪CPU芯片有哪些?网友:真详细
  7. C/C++中函数指针的含义(转)
  8. yamdi 实现添加元数据的注入flv文件,实现Nginx搭建flv视频浏览器上点播拖拽
  9. java Runtime
  10. html中多个网页的跳转页面,Html --- Footer 多页面应用跳转
  11. OrCAD(一)简介、安装与基本使用
  12. 上海电力大学本科毕业论文答辩PPT模板
  13. AUTOCAD——文字样式
  14. 微信小程序wxacode.getUnlimited 生成圆形二维码
  15. Android 侧边栏快速索引(点击索引、滑动索引),通讯录样式
  16. BTT6030芯片手册
  17. walking机器人仿真教程-应用-多点导航结合睡眠功能实现智能取药
  18. 关于Mars3D运行步骤以及调接口的问题
  19. BFU数据结构头歌实验:基于BF算法的病毒感染检测
  20. zend debugger图文教程

热门文章

  1. json.converter
  2. js中onload与onunload的使用示例
  3. QT小控件-遥控按钮
  4. 机器学习算法基本过程与优缺点总结
  5. liunx c语言制作 微型web服务器 300行代码
  6. Ngrinder脚本开发各细节锦集(groovy)
  7. Hue(01)——Hue概述
  8. 数据湖(二):什么是Hudi
  9. 2021开鲁一中高考成绩查询,2021年通辽中考所有高中学校排名 通辽重点高中分数线...
  10. 计算机方面特长特招进北大,降60分!2019年清华、北大特招艺术特长生