学习链接:link
link2
建立线性回归相关模型之前,都需要对特征变量进行多重共线性分析。
有多重共线性的情况发生时,参数估计的结果不再具有有效性,因此在进行回归分析之前我们需要通过VIF检验来排除掉某些有多重共线性的变量。

VIF方差膨胀因子(variance inflation factor)计算公式如下:
VIF=11−R2{\rm VIF}=\frac{1}{1-R^2}VIF=1−R21​
其中R2R^2R2是线性回归中的拟合优度/决定系数,描述了回归方程解释因变量的百分比。(具体见链接)

拟合优度R2R^2R2可以通过两种方式求得:

  1. 复相关系数的平方.
    复相关系数其实就是真实值yyy和回归后的y^\hat{y}y^​的相关系数。
    具体可以见这两篇文章:link1…link2

  2. 利用公式:
    R2=SSRSST=1−SSESSTR^2=\frac{SSR}{SST}=1-\frac{SSE}{SST}R2=SSTSSR​=1−SSTSSE​
    其中,SST=SSR+SSESST=SSR+SSESST=SSR+SSE.

现在回到方差膨胀因子VIF。
方差膨胀因子描绘的是每一个因变量和其他因变量之间的线性相关程度。所以,对于每一个自变量都有一个方差膨胀因子VFIi{\rm VFI}_iVFIi​。
一般认为VFIi>10{\rm VFI}_i >10VFIi​>10时,存在多重共线性,该特征需要删除。

python中计算VIF

from statsmodels.stats.outliers_influence import variance_inflation_factor

variance_inflation_factor(X,i)函数计算方差膨胀因子
X是矩阵
i是第i列

多重共线性分析 与 方差膨胀因子VIF相关推荐

  1. 多重共线性检验之方差膨胀因子VIF

    过程 1.构造每一个自变量与其余自变量的线性回归模型,例如,数 据集中含有p个自变量,则第一个自变量与其余自变量的线性组合可以 表示为 2.根据如上线性回归模型得到相应的判决系数R2R^2R2,进而计 ...

  2. 方差膨胀因子(VIF)学习

    参考博客:https://blog.csdn.net/jiabiao1602/article/details/39177125 1.导入数据,R自带研究共线性的数据集 该数据集有7个变量,其中GNP. ...

  3. python方差膨胀因子_讲讲共线性问题

    多重共线性是使用线性回归算法时经常要面对的一个问题.在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能:后者干脆假定变量之间是 ...

  4. python 方差膨胀因子 检验_从零开始学Python【22】--线性回归诊断(第一部分)

    往期回顾 前言 在上一期中,关于线性回归模型的创建,我们对比了Python和R语言的具体代码实现,受到了很多网友的关注.也有一些朋友问到,关于线性回归模型的那些前提假设为什么没有作分享,这期和下期我们 ...

  5. R语言使用car包的vif函数计算方差膨胀因子,并基于方差膨胀因子开方后和阈值(2)的判断来确认模型特征(预测变量)之间是否存在多重共线性(Multicollinearity)

    R语言使用car包的vif函数计算方差膨胀因子,并基于方差膨胀因子开方后和阈值(2)的判断来确认模型特征(预测变量)之间是否存在多重共线性(Multicollinearity) 目录

  6. 因变量 方差膨胀系数_请问如何计算潜变量的方差膨胀因子(VIF)?

    这里提供一个 Python 实现的方法和原理趣分析 方差膨胀因子是非常经典缓解多元共线性的方法,原理简单,实现优雅,效果拔群.源代码源数据可私聊俺获取,每天固定时间查看和回复. 原理趣析 多重线性回归 ...

  7. 多元线性模型分类变量方差_第三十一讲 R多元线性回归中的多重共线性和方差膨胀因子...

    在前两讲中,我们介绍了多元线性回归的概念以及多元线性回归中的交互作用.今天学习的主要内容是多元线性回归中的多重共线性和方差膨胀因子. 1. 共线性的概念 1 共线性 在多元回归中,两个或多个预测变量可 ...

  8. R计算方差膨胀因子(VIF,Variance Inflation Factor)计算并解读VID与共线性(Multicollinearity)的关系实战

    R计算方差膨胀因子(VIF,Variance Inflation Factor)计算并解读VID与共线性(Multicollinearity)的关系实战 目录

  9. 检验多重共线性matlab_异方差太难?检验通不过?横截面分析难题的十大暴击!...

    转载:计量与统计 横截面数据是在同一时间,不同统计单位相同统计指标组成的数据列.横截面数据不要求统计对象及其范围相同,但要求统计的时间相同.也就是说必须是同一时间截面上的数据. 在分析横截面数据时,应 ...

  10. 计量经济学学习笔记:多重共线性、异方差、自相关

    多重共线性.异方差.自相关 多重共线性 异方差 自相关 多重共线性 1 多重共线性是指各个解释变量之间有准确或近似准确的线性关系. 2 多重共线性的原因: (1)经济变量之间具有共同变化趋势. (2) ...

最新文章

  1. 207. Course Schedule 210. Course Schedule II
  2. python3 字典 dict 创建 添加 修改 复制 取值 删除
  3. 009_JMS中的事务
  4. java-模拟出栈入栈
  5. 在c 语言中stdio,C语言中,什么时候用到stdio.h之外的解释文件
  6. 原型模式的应用场景_前端常用设计模式
  7. .NET 6 中的 LINQ 更新
  8. 在WildFly和OpenShift上的WebSocket聊天
  9. 12-事件委托(事件代理)
  10. SRTP参数及数据包处理过程
  11. LeetCode 109. 有序链表转换二叉搜索树
  12. 网络编程-TCP/IP各层介绍(5层模型讲解)
  13. apqp过程流程图范本_过程流程图(APQP要求)
  14. Linux 下rzsz最新安装方法
  15. 五种IO模型:阻塞IO和非阻塞IO、同步IO和异步IO
  16. C++ Primer 中文版(第 5 版)练习解答合集
  17. 人力资源管理系统课程设计
  18. Win10系统任务栏出现假死现象的解决办法
  19. Android WallpaperManager 同时设置桌面壁纸与锁屏的问题
  20. python基于requests库实现12306火车票余票信息以及票价信息查询

热门文章

  1. 浙江大学计算机保研条件_2020年计算机系保研推免记录(浙江大学软件学院)...
  2. port isolate enable命令
  3. 微信好友排行榜 最简教程 一
  4. [转载] 古稀之年被判无期,84 岁再成亿万富翁,一代商业传奇落幕!
  5. 陈小龙linux及服务器正文 配置rewrite
  6. 【83行代码获奖代码】高中生@青藤木子 耗费一周给妈妈编写了一款语音识别APP
  7. qt textbrowser的边界框怎样改变颜色_专访天使投资人续沛川:用深度思考打破人生边界,拥有张力一生...
  8. brew安装nvm报nvm command not found解决方案
  9. linux 添加sbit权限,Linux特殊权限SUID、SGID、SBIT
  10. 简述html的文档基本结构,【简答题】简述 HTML 文档的基本结构。