两个变量与因变量相关性分析

提问:用SPSS一个分析,有一个因变量和N个自变量,先做相关性发现有很多自变量与因变量有关,相关性也比较高.

继续说,但是再做多重回归方程的时候只有3个因变量入选,其他都被排除了,那在写文章的时候那些被排除了的有相关性的因变量该怎么处理呢?

这说明这些变量之间存在自相关,模型选择的是代表程度更高且自变量相互之间相关性低的自变量来,以保证自变量变化时,只影响因变量,而不影响其它模型中的自变量.

建议你对这些自变量做两两之间的相关性检验,以说明他们不适合同时存在于模型中.

追问:这个是所谓的共线性的问题么?那我做自变量两两之间的相关性检验,什么样的结果才能显示他们不适合同时出现在模型中呢?

追答:你进行自变量之间的相关性检验,结果就会出来他们之间的相关性很高。 至于具体到模型中,得看具体的情况了,我也没有经验值。但是建模的时候一定要选择合适的变量进入方式。

最佳答案:

1.多重共线性的概念:

所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。

完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

2.多重共线性产生的原因   主要有3各方面:   (1)经济变量相关的共同趋势   (2)滞后变量的引入   (3)样本资料的限制 3多重共线性的解决方法

多重共线性的处理方法一般有如下的几种

1 增加样本容量,当线性重合是由于测量误差引起的以及他仅是偶然存在于原始样本,而不存在于总体时,通过增加样本容量可以减少或是避免线性重合,但是在现实的生活中,由于受到各种条件的限制增加样本容量有时又是不现实的

2剔除一些不重要的解释变量,主要有向前法和后退法,逐步回归法.

前进法的主要思想是变量由少到多的,每次增加一个,直至没有可引入的变量为止.具体做法是首先对一个因变量y和m个自变量分别建立回归方程,并分别计算这m个回归方程的F值,选其最大者,记为Fj,,给定显著性水平F,如果Fj>F,则变量引入该方程,再分别对(Xj,X1),(Xj,X2)…(Xj,Xm)做回归方程,并对他们进行F检验,选择最大的Fi值,如果Fi.>F,则该变量引入方程,重复上述步骤,直到没有变量引入为止.

后退法,是先用m个因变量建立回归方程,然后在这m个变量中选择一个最不显著的变量将它从方程中剔除,对m个回归系数进行F检验,记所求得的最小的

一个记为Fj,给定一个显著性的水平,如果Fj逐步回归法,前进法存在着这样的缺点当一个变量被引入方程时,这个变量就被保留在这个方程中了,当引入的变量导致其不显著时,它也不会被删除掉,后退法同样存在着这样的缺点,当一个变量被剔除时就永远的被排斥在方程以外了,而逐步回归法克除了两者的缺点.逐步回归的思想是有进有出.将变量一个一个的引入,每引入一个变量对后面的变量进行逐个检验,当变量由于后面变量的引入而不变的不显著时将其剔除,进行每一步都要进行显著性的检验,以保证每一个变量都是显著的.

理论上上面的三种方法都是针对不相关的的数据而言的,在多重共线性很严重的情况下,结论 的可靠性受到影响,在一些经济模型中,要求一些很重要变量必须包含在里面,这时如果贸然的删除就不符合现实的经济意义.

3.不相关的系数法.当变量之间存在着多重共线性最直接的表现就是各个解释变量之间的决定系数很大.考虑到两个变量之间的决定系数众所周知, 在多元线性回归模型中, 当各个解释变量( 如Xi 与Xj, i≠j) 之间存在着多重共线性时, 其最直接的表现就是各个解释变量之间的决定系数(ri2,j)很大.ri2,j 很大, 则意味着重要变量Xi( 在本文中, 为研究方便, 我们始终假定Xi 相对于Xj 而言, 是一重要变量, i≠j) 的变化能够说明Xj 的变化.如两者之间的r2,j=90%, 则我们以说, Xi 的变化说明了Xj 变化的90%,而剩余的( 1- ri2,j) 部分,则是由Xj 自身的变化说明的.由此决定, 在反映被解释变量(Y)与解释变量Xi,Xj 之间的关系时, 对于解释变量Xj 来说, 并不需要用全部的信息来解释被解释变量的问题, 而只需要用剩余的( 1- ri2,j) 部分的信息来解释就足够了,因为有ri2,j 部分的信息是与Xi 相重复的, 已由Xi 解释了.由此出发, 如果我们能够在保留重要变量(Xi) 全部信息的同时, 以重要变量(Xi) 为基础, 对其他的解释变量进行一定的线形变换, 使之转换为一个新变量, 如将Xj 转换为Xjj , 并且使得Xi 与新变量Xjj 之间的决定系数( ri2,jj) 降低到最小程度———如( 1- ri2,j) , 则就可以消除多重共线性.

喜欢 (5)or分享 (0)

python多变量相关性分析_两个变量与因变量相关性分析_spss多变量相关性分析相关推荐

  1. 用spss做多组两两相关性分析_两独立样本T检验及如何利用SPSS实现其操作

    上一篇文章我们讲解了有关单样本T检验的相关内容(如何使用SPSS进行单样本检验),其实论文中除了常用到的单样本T检验以外,还有另外一种T检验的方法也是经常用到的统计方法,也就是两独立样本T检验 说到T ...

  2. sklearn 相关性分析_人工智能和大数据的骨架支点—— 机器学习之相关性分析

    内容架构: 第一部分:简单线性回归 第二部分:如何用逻辑回归分类 第三部分:kaggle和泰坦尼克号预测 第一部分:简单线性回归 一.机器学习(Machine Learning, ML) 是机器学习算 ...

  3. java互换_两个变量交换的四种方法(Java)

    对于两种变量的交换,我发现四种方法,下面我用Java来演示一下. 1.利用第三个变量交换数值,简单的方法. (代码演示一下) 1 class TestEV 2 //创建一个类 3 { 4 public ...

  4. jmeter性能分析_使用JMeter和Yourkit进行REST / HTTP服务的性能分析

    jmeter性能分析 我的上一篇文章描述了如何使用JMeter完成异步REST / HTTP服务的压力测试或负载测试. 但是,运行这样的测试通常表明被测系统不能很好地应对增加的负载. 现在的问题是如何 ...

  5. python骰子游戏分析_两个骰子的Python概率骰子游戏

    我想在下面的函数上重复1000次,看看你在这个游戏中是赢了还是亏了钱.在 这个游戏是这样设计的,你扔一对骰子,然后拿回钱或是零花钱.假设我们从5个硬币开始.在 掷一个12得到1.5硬币.在 投掷一枚1 ...

  6. python字符串单个替换_如何用变量替换列表中的单个字符串?

    我正在编写一个脚本,用python为程序maya创建一个命名约定. 我将使用它来命名脚本创建的所有对象.在 例如,以左膝关节为例.脚本会传递这样的信息 ("bind"," ...

  7. python创建一个类初始化两个变量name、age_Python小白入门:第八讲||类

    Python 是一种面向对象的编程语言.在面向对象编程中,你编写表示现实世界中的事务和情景的类,并基于这些类来创建对象. 编写类时,你定义的一大类对象都有的通用行为.基于类创建对象时,每个对象都自动具 ...

  8. python嵌套循环执行顺序_两个嵌套for循环的执行顺序

    展开全部 当两个或2113多个循环语句嵌套时,执行5261顺序按照一下步骤: 1.先判断最外4102层循环条件,若1653满足条件则进入第一层循环体. 2.进入第一层循环体后再次遇到循环语句进行第二层 ...

  9. python方差选择样本_两个样本方差比的分布(来自Python的实验)

    模拟结果图 按照两个样本方差比分布的理论推导可以得到 这里 为样本方差, 为总体方差. 这里将对这一结论进行基于Python的计算机模拟.代码如下. 1 生成两个总体,总体1服从正态分布 ,总体2服从 ...

  10. python读取matlab数据_两分钟搞定Python读取matlab的.mat数据

    Matlab是学术界非常受欢迎的科学计算平台,matlab提供强大的数据计算以及仿真功能.在Matlab中数据集通常保存为.mat格式.那么如果我们想要在Python中加载.mat数据应该怎么办呢?所 ...

最新文章

  1. java saf_Java 8 Lambda表达式探险
  2. Closing Spring root WebApplicationContext
  3. c++学习笔记之输入/输出流
  4. Android之解决ScrollView嵌套RecycleView导致滑动冲突或者显示不全的问题
  5. 使用深度学习框架 Tensorflow 实现线性回归 (Linear Model)
  6. 高中计算机会考选修三知识点,2020高二物理会考知识点总结三篇
  7. 富士康欲进军电动汽车市场 目标占据市场10%份额
  8. 分页查询超时问题(1)
  9. Android含文档server结束(client UI接口异步请求的一部分)三
  10. C 和 CPP 混合代码cmath编译出错
  11. SiteMesh JSP布局框架介绍
  12. mybatis ——xml方式与动态sql
  13. PLC软件申请软件著作权登记指南(新申请)
  14. 11(1)-AirSim+四旋翼仿真-人工势场法动态避障
  15. 基于matlab的语音识别系统
  16. 字符串转json(JSON.parse报错)
  17. 如何发一条九宫格图片的朋友圈
  18. ttl低电平接大电阻_电压不稳定?那是你不懂上拉/下拉电阻原理,5分钟教你应用!...
  19. Bypass UAC 提权
  20. Android常用RGB值以及中英文名称

热门文章

  1. 【2019年5月23日】指数估值排名
  2. openjudge 买书
  3. 重装win10系统(纯净win10系统)
  4. 原来网站上可以这样嵌套动态google地图
  5. 高等数学:第七章 空间解析几何(2)数量积 向量积 混合积 曲面及其方程
  6. LESS CSS 框架简介
  7. 【一键安装+Docker】无视系统,十几个ROS版本任你选择
  8. java代码下划线是啥意思_java类名加下划线
  9. 有料科普 | 有一说一,BIM和CIM的这层关系,你了解吗?
  10. 伪随机数的爆破--2