spss实现中心化处理、标准化处理和归一化处理
文章目录
- 一、中心化、标准化、归一化简单描述
- 二、中心化处理
- 三、标准化处理
- 四、归一化处理
- 五、参考资料
一、中心化、标准化、归一化简单描述
- 意义:数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。
- 原理:
数据标准化:是指数值减去均值,再除以标准差;
数据中心化:是指变量减去它的均值。
归一化:把数变为(0,1)之间的小数
二、中心化处理
数据的中心化是指原数据减去该组数据的平均值,经过中心化处理后,原数据的坐标平移至中心点(0,0),该组数据的均值变为0,以此也被称为零均值化。
简单举例:譬如某小公司老板员工共5人,5人的工资,分别为12000、5000、8000、3000、4000元,这5个数据作为一个独立的数据集,平均值为6400元,每个人的工资依次减去平均水平6400,得到5600、-1400、1600、-3400、-2400,新的5个数据其平均值等于0,这个过程就是数据的中心化。
下面详细讲解在SPSS中的操作步骤。
第一步:在分析选择描述统计,接着选择描述。
第二步:选择所要分析的变量,在选项中勾选平均值即可。
输出得到每个变量的平均值如下
描述统计 | ||
个案数 | 平均值 | |
学术氛围 | 191 | 15.9843 |
学习收获 | 191 | 16.3351 |
自主学习 | 191 | 13.4241 |
授课水平 | 191 | 23.5864 |
对自己大学教育质量评价 | 191 | 66.69 |
有效个案数 | 191 |
第三步:在工具栏区,在转换中选择计算变量
这里,我们第一个计算的是 授课水平这个变量,一开始先给中心化后的变量命名,接着选择变量,然后在输出的结果复制这个变量的平均值(建议直接复制过去),粘贴到数学表达式里面
我们第二个计算的是对自己大学教育质量评价这个变量,步骤同第一个变量。
最后,我们得到得到两个新的中心化处理的变量。
我们把这两个变量和新变量的描述性统计数据输出,查看它们的变化结果。
我们可以发现,它们的最大值和最小值都发生了改变,并且新变量的均值均为0,这是因为新的两个变量都用变量中的每个值减去均值,所以均值为0,而且我们可以发现它们的标准差和方差都没有发生变化,说明这个数据的形态和分布情况是没有发生改变的,只是平均值进行了移动。
三、标准化处理
大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。这就是数据标准化。
基本原理:数值减去平均值,再除以其标准差,得到均值为0,标准差为1的服从标准正态分布的数据。
在SPSS中,使用最多的就是Z-score标准化(0-1标准化)方法,这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
在SPSS的处理步骤如下:
第一步:在分析中选择描述统计,接着选择描述。
第二步:选择所要标准化的变量。在下面勾选将标准化值另存为变量(Z),点击确定。
我们可以在变量视图发现这个时候新增加了标准化后的三个变量。
四、归一化处理
归一化方法:
- 把数变为(0,1)之间的小数
主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速- 把有量纲表达式变为无量纲表达式
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。
归一化,也算是数据标准化方法之一。常见的计算公式如下,得到新数据范围在[0,1]之间,归一化由此得名。
x∗=x−minmax−minx^*=\frac{x-min}{max-min} x∗=max−minx−min
在SPSS的操作步骤如下:
第一步:在分析选择描述统计,接着选择描述。
第二步:选择变量和指定输出最大值和最小值。 第三步:在**转换**中选择**计算变量**。
接着在表达式中输入相应的计算公式
可直接在输出窗口复制最大值和最小值。
我们可以在描述统计里面查看授课水平和归一化处理后变量的统计结果的区别。
我们可以看到,归一化后,新数据范围在[0,1]之间。
五、参考资料
- 什么是数据标准化、中心化、归一化?SPSS又如何实现?
- 数据的中心化、标准化和归一化
spss实现中心化处理、标准化处理和归一化处理相关推荐
- 机器学习中之规范化,中心化,标准化,归一化,正则化,正规化
一.归一化,标准化和中心化 广义的标准化: (1)离差标准化(最大最小值标准化) (2)标准差标准化 (3)归一化标准化 (4)二值化标准化 (5)独热编码标准化 归一化 (Normalization ...
- 数据的中心化和标准化
简介: 意义:数据中心化和标准化在回归分析中是取消由于量纲不同.自身变异或者数值相差较大所引起的误差. 原理:数据标准化:是指数值减去均值,再除以标准差: 数据中心化:是指变量减去它的均值. 目的:通 ...
- 数据的中心化和标准化处理
1.意义:数据中心化和标准化在回归分析中是取消由于量纲不同.自身变异或者数值相差较大所引起的误差. 注解: 单位具有实际的物理意义,而量纲则不一定.比如说焦耳,表示能量,具有实际物理意义就是单位(同时 ...
- 主成分分析——数据中心化与标准化处理
在主成分分析法中,一般来说,我们进行的第一步应该是对所有样本数据进行中心化,甚至是标准化处理.那么我们为什么要对样本数据进行中心化和标准化处理呢? 在一般的实际问题当中,我们要分析的数据一般是多个维度 ...
- 归一化,去中心化,标准化和欧拉变换
1.Normalization 归一化和标准化没有特别的分界 在图像里的归一化一般是将图像的灰度值归一化到0-1或者0-255. 在机器学习中一般对数据标准化为正态分布,均值为0,方差为1. 去中心化 ...
- R语言入门(22)-数据的中心化与标准化
数据中心化是指数据集中的各项数据减去数据集的均值. > x <- c(2,3,4,4,4,5,34) > mean(x) [1] 8 > x-mean(x) [1] -6 -5 ...
- 用spss进行数据的标准化处理_什么是数据标准化、中心化、归一化?SPSS又如何实现?...
在统计分析.数据挖掘过程中,经常性的接触到数据的标准化处理.数据中心化处理,还有数据归一化处理,那么它们各自是什么意思?如何通过SPSS软件实现呢? 大型数据分析项目中,数据来源不同,量纲及量纲单位不 ...
- 数据预处理之中心化(零均值化)与标准化(归一化)
数据预处理之中心化(零均值化)与标准化(归一化) 目的: 通过中心化和标准化处理,最终得到均值为0,标准差为1的服从标准正态分布的数据.可以取消由于量纲不同.自身变异或者数值相差较大所引起的误差. 原 ...
- 标准化、归一化、中心化
标准化.归一化.中心化 数据分析及挖掘中常提到的几个概念(数据的 标准化.归一化.中心化),虽然经常在用,但可能还是有一些比较生僻的知识容易搞混淆,所以在十月国庆大家都出门上高速堵车的时候抽了点时间对 ...
- matlab 均值中心化,数据预处理之中心化(零均值化)与标准化(归一化)
在机器学习回归问题,以及训练神经网络过程中,通常需要对原始数据进行中心化(零均值化)与标准化(归一化)处理. 背景 在数据挖掘数据处理过程中,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响 ...
最新文章
- Python基础10-函数基础
- 速卖通新手入驻必须了解的“9大知识点”
- Java虚拟机类加载机制——案例分析
- getHibernateTemplate()的find用法大全
- 再读《精通css》00
- selector的使用
- java中如何使用jdk_java – 如何在JDK7中使用目录globbing
- Android Studio1.4.x JNI开发基础-基本环境配置
- 360修复高危漏洞可以修复吗_大理石刮痕可以修复吗?如何修复?
- 非线性动力学_利用非线性动力学系统研究混沌现象
- 转载-信息化与系统集成技术-全面解析工业4-0和云计算、大数据
- Carsim安装中遇到的一些坑(invalid license key)
- java并发编程——创建线程之Thread 和 Runnable
- 跑步时戴什么耳机好、分享五款最适合跑步的运动耳机排名清单
- domino服务器库文件,Domino 服务器设置程序 涉及的文件
- 无人机自由飞行测试台 FFT GYRO 600
- 服务器系统对比、数据库对比、后台开发语言对比
- 化工厂人员定位如何实现,主要有哪些功能?
- HTML特殊转义字符 Javascript转义字符
- 中文文本分类的java包_java实现中文文本分类
热门文章
- (四)Selenium通过谷歌插件实现使用隧道代理
- 来和大家聊一聊“蓉叶云库”
- 小程序源码:微信零钱模拟器
- android 5.0判断服务是否开启中,android5.0之后版本服务出现的显示问题解决方案
- PHP距离春节还剩多少天,距离2019年春节还剩多少天 2019春节倒计时多少天
- labelme 语义分割数据集_【综述系列】语义分割研究要用到的数据集介绍(一)...
- 解决耳机插入电脑没声音问题
- 华为移动wifi显示无服务器,华为移动wifi设置方法
- 美股全线收涨 特斯拉涨超7% 瑞幸大跌近13%
- c语言笔段式,走势划分笔段中枢的区别及缠论操作核心技术