哑变量又称虚拟变量(Dummy Variable),又称虚设变量、名义变量或哑变量,是量化了的质变量,通常取值为0或1。

在研究一个因变量的时候,解释变量中除了定量变量,有时候会有一些定型变量,比如性别、年龄、宗教、民族、婚姻状况、教育程度等。这些定性变量也可以成为指标变量、二元变量或分类变量。此时需要使用虚拟变量。

模型中引入虚拟变量的作用 1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。

2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。

3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)

虚拟变量设置的原则 在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:  如果有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。

引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。

如果某个因素有n种选择,则将其用哑变量引入模型时,要设置n-1个哑变量,以避免完全的多重共线性。如性别的选择有两种,则引入一个哑变量,是男则数值为1,否则为0,当然也可以设置为女为1,否则为0。季节的选择有4个,则引入3个哑变量,哑变量1:春为1,否则为0.哑变量2:夏为1,否则为0.哑变量3:秋为1,否则为0

SPSS的具体操作

Recode——into different

variables…——把“类别变量”选入“待转换变量” 框中,在Output Variable 框的Name 和 Lable

中分别输入新变量名和标签,然后change——old and new:在Old  values

的Value 中输入1,在New Value

中输入1码,然后add,其次分别输入2、0,add;以此类推,最后输入7,0,add——continue——ok.

这样就编完了以“第一项”为1,其他科研项目为0的一个二分变量。接着继续编以“第二项”为1,其他为0的二分变量;其它选项以此类推。

注意

定义好所有的哑变量之后,接下来就可以进行多元线性回归的计算了。由于哑变量是一个整体变量,所以进行变量筛选时必须共同进退。因此,将所有哑变量同一般变量一下直接进行筛选是不对的,会出现一部分变量进入一部分变量未进入的情形。

解决的方法是:将同一因素下的哑变量进行归组(block),在纳入方法中选择了“ENTER”来确保这些哑变量同进同出,而其它因素的哑变量另一组(block),除哑变量之外,其余自变量归为一个block,纳入方法为STEPWISE。结果的解读方面,只要哑变量有其中一个有统计学显著性,就应该把整个因素包含的哑变量纳入回归方程。

解析:虚拟变量是相对来看的。比如年级变量有三个年级:一年级 二年级

三年级。设置了两个虚拟变量,如果这两个虚拟变量有差异,理解为这两个虚拟变量相对于另一个年级有显著差异。同差将第一个值作为参考对象,即将一年级作为参考对象,那两个虚拟变量分别就表示二年级和三年级,当出现显著差异,就表示二年级和三年级相对于一年级在因变量上有显著差异。数据分析培训

python虚拟变量回归_哑变量 虚拟变量 线性回归_spss 线性回归 哑变量相关推荐

  1. python 分类变量回归_极简Python带你探索分类与回归的奥秘

    为何使用人工智能和机器学习? 地球的未来在于人工智能和机器学习.如果对这些技术一无所知,人们很快会发现自己落伍了.世界发展日新月异,每天都发生着不可思议的变化.在人工智能和机器学习中,有许多实现和技术 ...

  2. python 什么可以作为变量名_为什么强烈禁止开发人员使用isSuccess作为变量名

    在日常开发中,我们会经常要在类中定义布尔类型的变量,比如在给外部系统提供一个RPC接口的时候,我们一般会定义一个字段表示本次请求是否成功的. 关于这个"本次请求是否成功"的字段的定 ...

  3. 自定义变量 配置文件_「系统架构」Nginx调优之变量的使用(3)

    在上一篇文章「系统架构」Nginx调优之变量的使用(2)中我们介绍了自定义变量和内置变量,下面我们继续接着介绍Nginx中变量的可见性和动态内置变量. 变量的可见性 nginx中的变量虽然不全是全局变 ...

  4. 小米机器人虚拟墙设置_扫地机器人虚拟墙应该怎么放置使用

    原标题:扫地机器人虚拟墙应该怎么放置使用 现在高端的智能吸尘器产品都配备了虚拟墙功能,能够有效正确指挥扫地机工作.那么,对于我们在日常使用中该如何使用虚拟墙呢? 什么是虚拟墙? 很多人购买产品的时候对 ...

  5. 小米机器人虚拟墙设置_扫地机器人虚拟墙介绍及怎样设置

    原标题:扫地机器人虚拟墙介绍及怎样设置 现在高端的智能吸尘器产品都配备了虚拟墙功能,能够有效正确指挥扫地机工作.那么,对于我们在日常使用中该如何使用虚拟墙呢? 什么是虚拟墙? 很多人购买产品的时候对虚 ...

  6. 用python做逻辑回归_用Python来实现逻辑回归

    1,什么是逻辑回归(Logistic Regression) 逻辑回归用于二分分类问题,二分分类问题的标签值只有两个,比如 对于一首歌喜欢或者不喜欢:对于一件商品,喜欢或者不喜欢:对于某个考生,考试成 ...

  7. 用python做lasso回归_解析python实现Lasso回归

    Lasso原理 Lasso与弹性拟合比较python实现 import numpy as np import matplotlib.pyplot as plt from sklearn.metrics ...

  8. python决策树逻辑回归_百面机器学习(逻辑回归以及决策树,leetcode)

    逻辑回归,分类问题,线性分类器,通过线性回归逼近对数几率,适用于高维稀疏数据的场景,如果数据包含一条决策边界,因为单位阶跃函数不连续,采用sigmoid函数来表示. 优点和缺点 优点: (模型)模型清 ...

  9. 多元线性模型分类变量方差_第三十一讲 R多元线性回归中的多重共线性和方差膨胀因子...

    在前两讲中,我们介绍了多元线性回归的概念以及多元线性回归中的交互作用.今天学习的主要内容是多元线性回归中的多重共线性和方差膨胀因子. 1. 共线性的概念 1 共线性 在多元回归中,两个或多个预测变量可 ...

  10. python线性加权回归_第二十一章 regression算法——线性回归局部加权回归算法(上)...

    理论部分 回归是统计学中最有力的工具之一.监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型.连续性而定义的.顾名思义,分类算法用于离散型分布预测,如KNN.决策树.朴素贝叶 ...

最新文章

  1. Linux服务器CPU、内存、磁盘空间、负载情况查看python脚本
  2. Spring 3 HornetQ 2.1集成教程
  3. 【飞秋】OpenExpressApp对建模支持的初步计划
  4. matlab函数包_Matlab论文插图绘制的270种补充颜色
  5. php 禁止ajax 重复请求,js ajax请求防止重复提交
  6. 【路径大全】iphone所有文件路径。CYDIA
  7. 神器 Wineskin 基础教程
  8. win10卸载ie11后安装不上
  9. Vue中的keep-alive组件
  10. Redis从入门到集群分布式实践
  11. C语言学习(七)之数组
  12. setResulttransformer过期NativeQueryImpl,cannot be cast to org.hibernate.query.internal.NativeQueryImpl
  13. 关于windows 10开机自动修复的解决办法
  14. 《Qt5:同一个界面多窗口或者多页面切换(QStackedWidget)》
  15. 机器学习的所有资源链接和经验教训(五)ML技术讲座
  16. 在线报表设计实战系列 – ③制作交叉分析表
  17. 计算机连接不上蓝牙鼠标,win10系统蓝牙鼠标连接不上的图文教程
  18. word中文分词 一
  19. openlayers版本更新差别
  20. 【语音去噪】基于matlab GUI切比雪夫+椭圆形低通滤波器语音去噪【含Matlab源码 2198期】

热门文章

  1. 阅读《Android 从入门到精通》(10)——单项选择
  2. 跳槽季,你该如何写简历,简历准备好了吗?
  3. React-Pdf使用过程心得
  4. con 元器件符号_Protues 元器件符号
  5. 机器学习如何影响系统设计:Learned Index Structures浅析
  6. 制作海报,你一定会用到的这些工具网站
  7. ape flac 音频截取_为什么选择FLAC音频
  8. 图片编辑助手小程序_图片加文字_快速拼图_表情包制作
  9. 通俗易懂的Spatial Transformer Networks(STN)(二)
  10. 随笔 - 记录下当前的生活