原标题:SPSS统计分析案例:数据标准化

数据标准化处理是 数据挖掘 的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标即处于同一数量级,适合进行综合对比评价。

极差法

极差法是对原始数据的线性变换,首先计算指标值得最小值、最大值,计算极差,通过极差法将指标值映射到[0-1]之间。公式为:

新数据=(原数据-极小值)/(极大值-极小值)

Z-score标准化法

SPSS默认的数据标准化方法即是Z得分法,这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。公式为:

其中μ为所有样本数据的均值,σ为所有样本数据的标准差。

数据标准化的另外一个实用之处

在实际应用中,数据标准化不只是用于指标的可比性处理,还有一些非常实用的用处,利用标准化方法将指标归到最适于我们观测的范围,更加直观。且看案例:

有一组数据,是学生参加某次社会公益活动的数据,其中有一指标为:在校综合评价指数,反映学生在校综合表现水平。

可以看出这个指标的范围为[0-140],但这个范围不太符合我们在学校里的习惯,在学校里经常用[0-100]的百分制,60分以上基本认可为及格,现在这个范围不能直观的反映学生在校表现水平。此时,极差法是一个非常好的选择,我们可以将[0-140]数值,映射到[0-100],便于直观对比学生的表现。

公式为:(原数据-极小值)/(极大值-极小值)*100

我们再来看看结果:

此时,[0-100]的范围非常符合我们日常的比较标准,能直观的反映学生的在校综合表现,已经达到目的。

——————

SPSS统计训练营(微信号spsser)是一个自学平台,以详实统计案例教程为基础,配套练习使用的原始数据,方便读者自己实践,致力于让数据科学学习简单有趣高效。发起人数据小兵,资深数据分析师,SPSS套件爱好者,愿与科研工作者、行业数据分析者学习交流,欢迎订阅。返回搜狐,查看更多

责任编辑:

用spss进行数据的标准化处理_SPSS统计分析案例:数据标准化相关推荐

  1. .dat数据文件怎么打开_SPSS统计分析,之一 SPSS数据文件读取

    简单地说,数据分析就是数据进行分析,从专业上说,数据分析就是依据分析目的,用适当的统计分析及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据作用,为企业的营销.战略的制定提供帮助和支持. ...

  2. 数据大清洗_Pandas库进阶(TGI指数分析案例)(统计分析案例)

    目录 一.TGI指数分析案例 二.连锁超市统计分析案例 一.TGI指数分析案例 什么是 TGI? TGI:即 Target Group Index(目标群体指数),可反映目标群体在特定 研究范围(如地 ...

  3. 用spss进行数据的标准化处理_什么是数据标准化、中心化、归一化?SPSS又如何实现?...

    在统计分析.数据挖掘过程中,经常性的接触到数据的标准化处理.数据中心化处理,还有数据归一化处理,那么它们各自是什么意思?如何通过SPSS软件实现呢? 大型数据分析项目中,数据来源不同,量纲及量纲单位不 ...

  4. R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行center中心化、scale标准化(每个数据列减去平均值、除以标准差)、设置参数为center和scale

    R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行center中心化.scale标准化(每个数据列减去平均值.除以标准差).设置method参数为center和scal ...

  5. R语言vtreat包自动处理dataframe的缺失值、计算数据列的均值和方差并基于均值和方差信息对数据列进行标准化缩放、计算所有数据列的均值和方差对所有数据列进行标准化缩放

    R语言vtreat包自动处理dataframe的缺失值.计算数据列的均值和方差并基于均值和方差信息对数据列进行标准化缩放.计算所有数据列的均值和方差并基于均值和方差信息对所有数据列进行标准化缩放 目录

  6. python归一化sklearn_用sklearn进行对数据标准化、归一化以及将数据还原详解

    如何用sklearn进行对数据标准化.归一化以及将数据还原 在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理. 这里通过使用sklearn.preprocess模块进行处理. 一 ...

  7. python实现数据恢复_使用sklearn进行对数据标准化、归一化以及将数据还原的方法...

    在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理. 这里通过使用sklearn.preprocess模块进行处理. 一.标准化和归一化的区别 归一化其实就是标准化的一种方式,只不 ...

  8. dataframe数据标准化处理_数据处理中的标准化、归一化究竟是什么?

    关注上方"Python数据科学",选择星标, 精彩文章不会错过! 今天说一个比较重要的内容,无论是在算法建模还是在数据分析都比较常见:数据归一化和标准化. 开始之前,请你先把网上看 ...

  9. php 根据一个数据组的id 取得另一个数据组对应的名称,怎样从两个spss的数据文件中选出id相同的数据,合并成一个文件...

    求教高手怎样从两个spss的数据文件中选出id相同的数据,合并成一个文件.谢谢.排序后用merge file操作,怎么原数据没有变化?output中提示这些 Renaming has created ...

  10. 使用sklearn进行对数据标准化、归一化以及将数据还原

    在对模型训练时,为了让模型尽快收敛,一件常做的事情就是对数据进行预处理. 这里通过使用sklearn.preprocess模块进行处理. 一.标准化和归一化的区别 归一化其实就是标准化的一种方式,只不 ...

最新文章

  1. cytoscape---插件clueGO的使用
  2. POJ3133(插头dp)
  3. 你在中国有去过那些地区?
  4. SaaS数据驱动浅谈
  5. stm32之USB应用实例(官方例程资料下载使用)
  6. 95-860-045-源码-定时器-InternalTimerService
  7. html span 字体位置,html – 如何强制span在CSS中使用父字体系列
  8. rownum的用法oracle
  9. 兼容ie10以下版本的placeholder属性
  10. 计算机应用基础论坛发帖,计算机应用基础串讲冲刺讲义(一)_IT教育论坛_计算机学习论坛_学赛网_IT在线教育平台...
  11. android 蓝牙串口指令,蓝牙串口助手
  12. 关于笔记本测试的面试准备 2021-10-11
  13. Zemax学习笔记(5)- 设计单透镜实例_2,分析
  14. 请领导批阅文件怎么说_汇报措辞:你懂得怎样向领导汇报吗(审阅、审批、批阅、批示、查阅)?...
  15. LOL服务器人数最新,英雄联盟大区人数排名
  16. 浮点数切分 C++
  17. LambdaQueryWrapper和QueryWapper的区别
  18. 一篇很好的EDP入门介绍文章——了解AUX,PSR,ASSR 以及EDP版本的差异
  19. CATIA V6二次开发——Automation之对象
  20. ngrok域名申请使用外网访问

热门文章

  1. linux 怎么在pe下安装驱动程序,【教程】再谈“万能驱动7在PE下安装驱动”功能...
  2. JDK1.8下载安装(Windows版)
  3. KCF算法数学推导及算法流程图
  4. 服务器里那个文件是地图的爆率,dnf这才是固伤职业最喜欢的地图,气息爆率是巨龙的4倍!...
  5. C语言输出大写金额,编程实现,输入一个人民币小写金额值,转化为大写金额值输出。先实现基本功能...
  6. visio输出论文用矢量图
  7. 【JVM】17、垃圾回收器
  8. ffmpeg学习日记5-使用ffmpeg进行h264解码
  9. STM32 HAL库 时钟芯片RX8025T IIC的读写操作,入过的坑
  10. 车站订票系统可行性分析报告