今天给各位分享怎么用spss做哑变量,也算是给不想敲代码的同学带来一些福利。

首先介绍下什么是哑变量。哑变量是由虚拟变量衍生过来,指的是非数值型的字符变量转换而来的变量,通常情况下这些变量都是无序的变量。如性别、职业等等。

因为如果你用0表示女,1表示男,这里数值上,由于1大于0,所以会造成在模型解释上取值为男的权重会比女的大,所以对于这样的无序变量,通常不使用有大小的数值表示。而是引入两个虚拟变量sex_0与sex_1;

另外对某些好似是有序的变量如教育程度,这些是不是应该用梯度的数值的表示,如果高中、专科、本科、硕士分别对应0、1、2、3.,我个人也建议结合自家的数据情况分析,比如学历里对于数值相差较大,难道不能取0,3,5, 6?

OK,本篇文章来实际介绍下如何给数值进行哑变量编码。这里我们引入spss工具。这个不需要敲代码的工作,现在是sas、python、R的天下,但本人觉得工具只是实现的手段,重要的是理解里面的原理。

我们本篇文章会介绍spss,并把相关的数据集跟下载链接,放在知识星球,各位有兴趣学习spss的可以上去下载破解版的软件跟数据集。

本次给各位介绍的是一份关于客户是否会愿意购买某超市产品的一份数据,里面包括的字段有性别(sex),负债能力(dept),产品价格(price),送货距离(distance)等数十个字段…然后我们去预测客户是否购买(purchase)产品,

首先,我们导入的数据如下:

具体的对应的数据如下:

我们此次选择用逻辑回归算法:

选取了purchase作为因变量,而此次为了操作简便只选取四个变量:sex, dept, price, distance;

接着需要把sex跟distance两个作为分类变量,进行相关的哑变量处理:

完成之后,直接单击下一步就完成了

输出以下结果:

可以看到哑变量输出里,因为性别是只有男女两个类型,所以哑变量只输出一个。而distiance有5种类型,输出4个哑变量;最后是关于其他数值的解读,我们有机会再在以后的文章里为各位解读。接下来,会有一部分关于spps的安装教程,我们也把下载的链接放在知识星球。

以下为安装教程:可略过

![图片](https://img-blog.csdnimg.cn/ae4fa2d2300648378ddd65a461d65de8.png











用spss做哑变量--给不敲代码同学福音相关推荐

  1. SAS中生成哑变量的一段宏代码

    我们在建模时,可能经常会有一些将分类变量(categorical variable)转换成哑变量(dummy variable)的需求.例如"成绩"是一个分类变量,内容包含&quo ...

  2. 三、数据预处理——处理分类型数据:编码与哑变量

    三.处理分类型特征:编码与哑变量 点击标题即可获取文章相关的源代码文件哟! 在机器学习中,大多数算法,譬如逻辑回归,支持向量机SVM,k近邻算法等都只能够处理数值型数据,不能处理文字,在sklearn ...

  3. Python对离散变量处理:哑变量编码和one-hot编码

    在数据进行建模分析,无法直接把类别变量放入模型中去分析,因此,需要对类别变量进行处理.最常见的方法是对类别变量做哑变量编码或one-hot编码,所以运用最近的业务数据进行了尝试.哑变量编码和one-h ...

  4. 如何在SPSS中设置逻辑回归的哑变量

    哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性. 哑变量的设置在各个回归模型中都非常重 ...

  5. matlab如何转换哑变量,SPSS教程:手把手教你设置哑变量及解读结果!

    将哑变量引入回归模型,虽然使模型变得较为复杂,但可以更直观地反映出该自变量的不同属性对于因变量的影响,提高了模型的精度和准确度. 举一个例子,如职业因素,假设分为学生.农民.工人.公务员.其他共5个分 ...

  6. 在R中做含有哑变量的gam模型并可视化

    R中建立包含哑变量的gam模型需要使用mgcv包.下面是一个例子: library(mgcv) set.seed(1) # 生成模拟数据 n <- 100 x1 <- rnorm(n) x ...

  7. 怎么用spss做冗余分析_用SPSS进行医学统计信度分析——【杏花开医学统计】

    杏花开生物医药统计 一号在手,统计无忧! 关 注 用SPSS进行医学统计信度分析 关键词:SPSS.信度分析 导 读 上期,我们介绍了量表的基本形式及其研制步骤. 点击观看:<医学研究中量表研制 ...

  8. 6、spss做logistic回归

    前边我们用两篇笔记讨论了线性回归的内容.线性回归是很重要的一种回归方法,但是线性回归只适用于因变量为连续型变量的情况,那如果因变量为分类变量呢?比方说我们想预测某个病人会不会痊愈,顾客会不会购买产品, ...

  9. 多元线性回归哑变量设置方法

    多元线性回归是研究一个连续型变量和其他多个变量间线性关系的统计学分析方法,如果在自变量中存在分类变量,如果直接将分类变量和连续性变量统一纳入模型进行分析是有问题的,尤其是无序分类资料,即使进入了模型, ...

最新文章

  1. NSString字符串常用知识点
  2. C#网络编程:4订立协议和发送文件
  3. 你在看Netflix,Netflix也在看你
  4. Python Django 一对多之插入多条数据示例
  5. Java基础知识强化之IO流笔记13:递归之不死神兔问题(斐波那契数列)
  6. 史诗级pg脚本,亲测好使
  7. “SHOT NOTE”新文具,构建虚实之桥
  8. linux io 分析,Linux 下的I/O性能分析 iotop
  9. 中央音乐学院计算机研究生,2020北京中央音乐学院硕士研究生招生复试电子音乐作曲、电子音乐技术理论等考生须知...
  10. 实时检索系统Zoie实现分析
  11. 领导力、愚狂和改变:爱因斯坦是否错了?
  12. mysql视图 外键_Mysql之视图、索引、外键、触发器、事务
  13. 单线、双线、三线以及BGP线路有什么区别?
  14. [UWP开发] Win10微博分享
  15. 【Java面试】Java面试简历—轻松月薪过w(附赠最全简历模板)
  16. 《RSSHub Radar》可以帮助你快速发现和订阅当前网站RSS的浏览器扩展
  17. Ubuntu发烧友三部曲 进阶篇
  18. 户外直播、慢直播、赛事直播等直播行业的未来发展趋势
  19. 恒指均线流区间突破法的构建
  20. L1-030 一帮一(分数 15)

热门文章

  1. 字符大小端aix linux,Go交叉编译的那些事
  2. 计算机加工的过程和类型,3.1.2计算机信息加工的过程和类型
  3. centos 7 mysql 中文,解决centOS7 下mysql插入中文字符报错相关问题
  4. php隐藏表单提交表单提交表单_浅谈php提交form表单
  5. vs code c语言json文件配置,解析VScode在Windows环境下c_cpp_properties.json文件配置问题(推荐)...
  6. vb6.0 listview隐藏水平方向滚动条_为Vuetify的UI组件添加滚动条
  7. xcorr函数_相关函数xcorr的用法及实例
  8. android自定义view设置高度,自定义View的宽高设定
  9. [mystery]-加密解密整理
  10. 仿MIUI音量变化环形进度条实现