多重共线性是指在变量空间中,存在自变量可以近似地等于其他自变量的线性组合

如果将所有自变量用于线性回归或逻辑回归的建模,将导致模型系数不能准确表达自变量对Y的影响。

比如:如果X1和X2近似相等,则模型Y = X1 + X2 可能被拟合成Y = 3 X1 - X2,原来 X2 与 Y 正向相关被错误拟合成负相关,导致模型没法在业务上得到解释。

在评分卡建模中,可能将很多相关性很高的变量加入到建模自变量中,最终得到的模型如果用变量系数去解释自变量与目标变量的关系是不合适的。

相关矩阵是指由样本的相关系数组成的矩阵,自变量相关系数过大意味着存在共线性,同时会导致信息冗余,维度增加。

设置相关系数的阈值,当大于threshold时,删除IV值较小的变量。

VIF(variance inflation factors)VIF =1/(1-R^2) 式中,R^2是以xj为因变量时对其它自变量回归的复测定系数。

VIF越大,该变量与其他的变量的关系越高,多重共线性越严重。如果所有变量最大的VIF超过10,删除最大VIF的变量。

参考:

多重共线性:python中利用statsmodels计算VIF和相关系数消除共线性_ab1112221212的博客-CSDN博客

https://www.cnblogs.com/wqbin/p/11109650.html(可决系数)

VIF,共线相关性理解相关推荐

  1. 前端入门学习笔记(三十五)vue.js入门(三)条件 v-if 与循环 v-for,v-for 中 in 和 of 的区别

    1.v-if v-if相当好理解,这里我就只贴实例代码了 <div id="app"><p v-if="true">现在你看到我了< ...

  2. 机器学习 多变量回归算法_如何为机器学习监督算法识别正确的自变量?

    机器学习 多变量回归算法 There is a very famous acronym GIGO in the field of computer science which I have learn ...

  3. 金融风控——Python建模

    金融风控基础篇 风控的基本概念 0 基于AI的风控应用 1 什么是信用风险? 2 信用模型和欺诈模型的区别 3 小额现金贷 vs 大额信贷 4 信用评分建模的基本流程 5 和风控建模相关的问题有: 数 ...

  4. Python探索性数据分析(EDA)统计数据和建模

    探索性数据分析(EDA) 在统计学中,探索性数据分析是一种分析数据集以总结其主要特征的方法,通常使用统计图形和其他数据可视化方法. 可以使用或不使用统计模型,但主要是 EDA 用于查看数据可以告诉我们 ...

  5. 谈谈 雷达信号处理之脉冲压缩

    写作时间:2020-06-30 目录: 1.概念说明 2.脉冲压缩怎么来的 3.脉冲压缩原理 4.可以进行脉冲压缩的信号 正文: 1.概念说明 概念澄清,在雷达信号处理中,脉冲压缩.匹配滤波.相关接收 ...

  6. 数据结构与算法分析-二叉树,树和森林

    二叉树,树和森林 考试内容 二叉树.树和森林的定义 树: 树(Tree)是n(n>=0)个结点的有限集,它或为空树(n= 0); 或为非空树,对于非空树T: 有且仅有一个称之为根的结点: 除根结 ...

  7. Vue详解及综合案例

    一.Vue简介 1.1 简介 Vue (读音 /vjuː/,类似于 view) 是一套用于构建用户界面的渐进式的js框架,发布于 2014 年 2 月.与其它大型框架不同的是,Vue 被设计为可以自底 ...

  8. 比较全面的随机森林算法总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 上节介绍了集成学习方法包括bagging法和boosting ...

  9. 吐血整理!万字原创读书笔记,数据分析的知识点全在这里了

    作者:JaneK 来源:大数据DT 导读:今天这篇文章是「大数据」内容合伙人JaneK关于<Python数据分析与数据化运营>的一篇读书笔记. 本文目录: Python数据分析与挖掘 01 ...

  10. Python 各种回归(含sklearn)

    机器学习 https://www.jb51.net/article/164603.htm 多元回归 https://zhuanlan.zhihu.com/p/61084966?utm_source=w ...

最新文章

  1. GPT-3模型为何难以复现?这也许是分布式AI框架的最优设计
  2. redis高可用原理及demo
  3. Programming WCF Services翻译笔记(五)
  4. VS也可以这样进行快捷安装
  5. 终端terminal的颜色配置
  6. Flash 杂志《summer tree》 第六期发布
  7. 微信小程序后端-PageHelper分页时查询结果重复问题
  8. python编程(多线程c回调python)
  9. GitHub 日收 7000 星,Windows 计算器项目开源即爆红!
  10. Win10系列:JavaScript动画3
  11. 计算机语言学习导论[C/C++]
  12. SpringMVC控制器单例和多例
  13. 03.CSS选择器--交集并集选择器
  14. Win8串口驱动完美支持
  15. ESP8266 Arduino 串口监控器有什么用
  16. 无法访问,您可能没有权限使用网络资源的解决
  17. windows系统——更改系统关机音效
  18. 企微裂变定位裂变,实现粉丝增长,提高客户留存率。
  19. xml使用外部DTD加载验证
  20. 使用AD8618设计ADC信号调理电路随笔

热门文章

  1. 树莓派GPIO远程控制继电器
  2. 新冠肺炎的诊断与临床症状
  3. 谷哥学术2022年2月资源分享下载列表 15/20
  4. java cxf encoded,java:JAXWS 2.0不支持Rpc / encoded wsdls
  5. numpy的stack大白话解释
  6. Mysql 中的事物
  7. 读《最重要的事只有一件》有感
  8. 搭建一套直播平台需要多少钱
  9. 小程序html转wxml,微信小程序用wxParse解析html
  10. 2021最新 阿里云部署 Flask + WSGI + Nginx 详解