在统计分析、数据挖掘过程中,经常性的接触到数据的标准化处理、数据中心化处理,还有数据归一化处理,那么它们各自是什么意思?如何通过SPSS软件实现呢?

大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。这就是数据标准化。

基本原理:数值减去平均值,再除以其标准差,得到均值为0,标准差为1的服从标准正态分布的数据。

在SPSS中,使用最多的就是Z-score标准化(0-1标准化)方法,这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。

SPSS具体操作是在【描述统计】菜单中完成,此时必须要勾选下方的【将标准化值另存为变量】,标准化后的新变量将保存在数据视图下原始数据最后一列,变量名称以大写字母Z开头。

数据的中心化是指原数据减去改组数据的平均值,经过中心化处理后,原数据的坐标平移至中心点(0,0),该组数据的均值变为0,以此也被称为零均值化。

简单举例:譬如某小公司老板员工共5人,5人的工资,分别为12000、5000、8000、3000、4000元,这5个数据作为一个独立的数据集,平均值为6400元,每个人的工资依次减去平均水平6400,得到5600、-1400、1600、-3400、-2400,新的5个数据其平均值等于0,这个过程就是数据的中心化。

在SPSS中,使用【计算变量】菜单,可衍生出一个新变量,输入表达式即可完成,新变量可以在数据视图下看到。

归一化

归一化,也算是数据标准化方法之一。常见的计算公式如下,得到新数据范围在[0,1]之间,归一化由此得名。

归一化处理,在SPSS中可以通过【计算变量】菜单来实现,在表达式中输入相应的计算公式即可。

用spss进行数据的标准化处理_什么是数据标准化、中心化、归一化?SPSS又如何实现?...相关推荐

  1. dataframe数据标准化处理_数据处理中的标准化、归一化究竟是什么?

    关注上方"Python数据科学",选择星标, 精彩文章不会错过! 今天说一个比较重要的内容,无论是在算法建模还是在数据分析都比较常见:数据归一化和标准化. 开始之前,请你先把网上看 ...

  2. dataframe数据标准化处理_对数据集做标准化处理的几种方法——基于R语言

    数据集--iris(R语言自带鸢尾花包) 一.scale函数 scale函数默认的是对制定数据做均值为0,标准差为1的标准化.它的两个参数center和scale: 1)center和scale默认为 ...

  3. 数据治理 主数据 元数据_我们对数据治理的误解

    数据治理 主数据 元数据 Data governance is top of mind for many of my customers, particularly in light of GDPR, ...

  4. 昆仑通态触摸屏数据转发上传_嵌_ModbusTcpIp数据转发 昆仑通态屏与屏之间通讯 - 下载 - 搜珍网...

    嵌_ModbusTcpIp数据转发/通_通/发送方.MCG 嵌_ModbusTcpIp数据转发/通_通/接收方.MCG 嵌_ModbusTcpIp数据转发/通_通/驱动路径说明.txt 嵌_Modbu ...

  5. python数据科学常国珍_《PYTHON数据科学:全栈技术详解》常国珍//赵仁乾//张秋剑著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 作者: 常国珍//赵仁乾//张秋剑著 出版社:机械工业出版社 出版时间:2018-07-01 00:00:00 版次:1 印次:1 印刷时间:2018-07-01 字数:250 页数:422 ...

  6. pci数据捕获和信号处理_通过更改数据捕获处理上游数据更改

    pci数据捕获和信号处理 Anyone who has managed a data pipeline would be aware of how the upstream data can chan ...

  7. 5000字 大数据时代读书笔记_《大数据时代》读后感5篇

    <大数据时代>读后感 5 篇 对于畅销书刊.热点话题.时尚科技,始终不太感兴趣.书 刊,喜欢有一定年份的.话题,钟情于务虚的观点.新奇的产品 于我无缘,习惯使用成熟的科技产品.既不清高,也 ...

  8. 关于大数据技术的演讲_百度大数据技术开放平台再度亮相

    众所周知,百度凭借在大数据领域多年的深厚技术积累,一直冲在产业智能化的最前线.在去年的百度AI开发者大会上,百度大数据发布了全新的大数据产品技术栈,覆盖了数据工程.数据科学.数据产品和行业解决方案,并 ...

  9. 大数据 智能交通调度_基于大数据技术的智能交通管理模式探析

    龙源期刊网 http://www.qikan.com.cn 基于大数据技术的智能交通管理模式探析 作者:熊姗姗 张昆 来源:<科学与信息化> 2020 年第 20 期 摘 要 随着社会的不 ...

最新文章

  1. iir数字滤波器_手把手教系列之一阶数字滤波器设计实现(附代码)
  2. k8s概念入门之control-manager-针对1.1.版本阅读
  3. 西门子绿色数据中心的“新”境界
  4. [Objective-C] 如何定义Block(块)
  5. python 终端打印表格--------pylsy 源码
  6. 关闭linux防火墙及selinux的关闭
  7. MD5加密方式-工具类
  8. select 设置发送超时发送注意事项
  9. node.js学习-整理
  10. 201521123062《Java程序设计》第10周学习总结
  11. JDK版本变化也太快了,意义有多大?
  12. OS实验xv6 6.S081 开坑
  13. java视频压缩 lz4_压缩包格式有哪些?
  14. 北美计算机专业申请,美国计算机专业名校TOP5申请深入解读
  15. 计算机单位厘米 像素,像素厘米转换器
  16. 数学中的两个重要极限公式
  17. java 聊天室 私聊_Java聊天室——实现多人聊天、私聊、群聊
  18. 14-eval 函数
  19. 关于软件快捷方式显示异常,任务栏小图标模糊的解决方案
  20. c#控制台模拟dos_超好用的C#控制台应用模板

热门文章

  1. Request method ‘GET‘ not supported 405错误辨析总结
  2. 【MIUI刷机】旧机降级记录
  3. 文案馆头像壁纸小程序源码 带后台
  4. 火狐开发版_Firefox普通版和开发版之间有什么区别?
  5. PostgreSQL on duplicate update
  6. 欢迎来到yoeodeity yoeo耀月
  7. 测肤API+应用开发,自助打开线上AI测肤
  8. CSS3 Clip-Path
  9. 异构数据源离线同步工具之DataX的安装部署
  10. 【Insights直播】华为帐号服务,打造全场景安全帐号体系