多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
1.可以计算X矩阵的秩qr(X)$rank,如果不是满秩的,说明其中有Xi可以用其他的X的线性组合表示;(完全的线性表示,此方法不能作为判别是否有共线性的标准,因为有可能存在共线性但不是完全线性相关)
2.也可以计算条件数kappa(X),k<100,说明共线性程度小;如果100<k<1000,则存在较多的多重共线性;若k>1000,存在严重的多重共线性。
例如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
collinear<-data.frame(
   Y=c(10.006, 9.737, 15.087, 8.422, 8.625, 16.289,
        5.958, 9.313, 12.960, 5.541, 8.756, 10.937),
   X1=rep(c(8, 0, 2, 0), c(3, 3, 3, 3)),
   X2=rep(c(1, 0, 7, 0), c(3, 3, 3, 3)),
   X3=rep(c(1, 9, 0), c(3, 3, 6)),
   X4=rep(c(1, 0, 1, 10), c(1, 2, 6, 3)),
   X5=c(0.541, 0.130, 2.116, -2.397, -0.046, 0.365,
        1.996, 0.228, 1.38, -0.798, 0.257, 0.440),
   X6=c(-0.099, 0.070, 0.115, 0.252, 0.017, 1.504,
        -0.865, -0.055, 0.502, -0.399, 0.101, 0.432)
)
XX<-cor(collinear[2:7])
kappa(XX,exact=TRUE#exact=TRUE表示精确计算条件数;
[1] 2195.908    #大于1000,有严重的多重共线性
# eigen(XX)

处理时可以进行逐步回归,用step()命令,比如你一开始的模型是fm=lm(),step(fm)选择最小AIC信息统计量就可以了。这种方法是排除引起共线性的变量,是解决多重共线性的比较常用方法!

3.可以使用方差膨胀因子(VIF)
1
2
library(car)
vif(lm.sol)

得到各个系数的方差膨胀因子,一般认为,当0<VIF<10,不存在多重共线性(注意:在《R语言实战》第2版P182中认为VIF>4就存在多重共线性);当10≤VIF<100,存在较强的多重共线性,当VIF>=100,多重共线性非常严重。是判断多重共线性的比较常用方法! 

R语言之多重共线性的判别以及解决方法相关推荐

  1. R语言添加Python模块错误的解决方法

    使用R Studio添加Python包pytdx时,使用reticulate(R包)中import来导入已下载好的pytdx(Python包) pip install pytdx # 先在终端中下载p ...

  2. c语言0xa9错误,16种C语言编译警告(Warning)类型的解决方法

    当编译程序发现程序中某个地方有疑问,可能有问题时就会给出一个警告信息.警告信息可能意味着程序中隐含的大错误,也可能确实没有问题.对于警告的正确处理方式应该是:尽可能地消除之.对于编译程序给出的每个警告 ...

  3. R语言构建随机森林模型错误解决:Error in y - ymean : non-numeric argument to binary operator

    R语言构建随机森林模型错误解决:Error in y - ymean : non-numeric argument to binary operator 目录 R语言构建随机森林模型错误解决:Erro ...

  4. R语言)不依赖求导的寻根方法:Nelder-Mead方法

    (R语言)不依赖求导的寻根方法:Nelder-Mead方法 牛顿法需要一阶和二阶导数,如果导函数不可用,则可以通过伪牛顿(Quasi-Newton)方法近似它们.如果导函数直接不存在怎么办?函数中存在 ...

  5. r语言 不同长度 list 转 dataframe_解决R效率问题—parallel多线程启动

    很多用R的小伙伴可能会抱怨R的效率问题,尤其是处理海量数据的时候.如果你确实这样认为,那是因为你大概不知道R也有多线程之说... R 提供各种各样的包以解决并行处理问题,其中snow包是最典型的之一. ...

  6. R语言 cannot open the connection 的解决办法

    首先给大家分享一个巨牛巨牛的人工智能教程,是我无意中发现的.教程不仅零基础,通俗易懂,而且非常风趣幽默,还时不时有内涵段子,像看小说一样,哈哈-我正在学习中,觉得太牛了,所以分享给大家!点这里可以跳转 ...

  7. 用matlab解决多重共线性问题,几种关于多重共线性回归问题的解决方法

    在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,--,Xk中的任何一个都不能是其他解释变量的线性组合.如果违背这一假定,即线性回归模型 ...

  8. R读取excel文件乱码 read.xlsx() 解决方法

    1. 参考[R语言]R读取含中文excel文件,read.xlsx乱码问题  该文章总结得很好,可以直接跳到最后看博主的总结. 2. 如果依旧是乱码那么用read.xlsx2()去读取excel文件, ...

  9. R语言多元统计包简介:各种假设检验 统计方法 聚类分析 数据处理

    转载自:http://blog.csdn.net/duqi_yc/article/details/9446707 www.biostatistic.net/统计分析 生物信息 sas matlab R ...

最新文章

  1. c# 中重载WndProc,实现重写“最小化”自定义功能的方法
  2. 2015北京网络赛 G题 Boxes bfs
  3. VOIP,PSTN,ISDN
  4. Unexpected end of JSON input while parsing near '...kwrap:false,directo'
  5. HTTP权威指南记录 ---- HTTP报文
  6. java 调用c 的dll,java如何调用C的dll
  7. java环境问题_1_JAVA语言的特点及配置环境问题
  8. C语言位运算的取反(~)真实原理解析
  9. 多智能体强化学习之值函数分解:VDN、QMIX、QTRAN系列优缺点分析(转载)
  10. MVCC(多版本并发控制)原理
  11. 线性系统大作业——0.一阶和二阶倒立摆建模与控制系统设计
  12. yandex.com搜索等级、限制设置
  13. 华为eNSP--4多个路由器连接配置(静态路由)
  14. 微软Azure动手实验营4月课程预告
  15. win8下去除QQ聊天窗口的广告
  16. C++:最小二乘法拟合直线
  17. NLP-生成模型-2016:CopyNet【Copy机制赋予seq2seq模型从源文本中复制词汇的能力,解决Decoder的OOV问题】
  18. matlab中kmeans聚类算法
  19. win11本地安装docker
  20. go 基于gin编写encode、decode、base64加密接口

热门文章

  1. 2021-2-20:请你说说分布式系统 BASE 理论是什么?
  2. 电大英语计算机免考条件,关于电大本科课程中英语免修免考的条件
  3. 从LFS到BLFS轻松上手
  4. Mac 中 遇到 Cannot lauch AVD emulator.
  5. 测试面试题集-UI自动化测试
  6. matlab 制作A*B棋盘格
  7. Matlab画图 线条的颜色、宽度等相关设置
  8. Java Servlet 实战入门教程-10-servlet 过滤器 Filter
  9. 读《理想国》——柏拉图
  10. 面试字节跳动前端工程师被拒了,只因为......