转载自:https://blog.csdn.net/bbbeoy/article/details/70185798

评价是现代社会各领域的一项经常性的工作,是科学做出管理决策的重要依据。随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单一指标对事物进行评价往往不尽合理,必须全面地从整体的角度考虑问题,多指标综合评价方法应运而生。所谓多指标综合评价方法,就是把描述评价对象不同方面的多个指标的信息综合起来,并得到一个综合指标,由此对评价对象做一个整体上的评判,并进行横向或纵向比较。

而在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。

目前数据标准化方法有多种,归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法,对系统的评价结果会产生不同的影响,然而不幸的是,在数据标准化方法的选择上,还没有通用的法则可以遵循。

常见的方法有:min-max标准化(Min-max normalization),log函数转换,atan函数转换,z-score标准化(zero-mena normalization,此方法最为常用),模糊量化法。本文只介绍min-max法(规范化方法),z-score法(正规化方法),比例法(名字叫啥不太清楚,归一化方法)。

数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上,常见的数据归一化的方法有:min-max标准化(Min-maxnormalization)也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。log函数转换通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下:看了下网上很多介绍都是x*=log10(x),其实是有问题的,这个结果并非一定落到[0,1]区间上,应该还要除以log10(max),max为样本数据最大值,并且所有的数据都要大于等于1。atan函数转换用反正切函数也可以实现数据的归一化:使用这个方法需要注意的是如果想映射的区间为[0,1],则数据都应该大于等于0,小于0的数据将被映射到[-1,0]区间上。而并非所有数据标准化的结果都映射到[0,1]区间上,其中最常见的标准化方法就是Z标准化,也是SPSS中最为常用的标准化方法:z-score 标准化(zero-meannormalization)也叫标准差标准化,经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:其中μ为所有样本数据的均值,σ为所有样本数据的标准差。


1 什么是数据标准化(Normalization)

将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

2 有哪些常用方法呢?

方法一:规范化方法

  • 也叫离差标准化,是对原始数据的线性变换,使结果映射到[0,1]区间。

方法二:正规化方法

  • 这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x使用z-score标准化到x’。
  • z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
  • spss默认的标准化方法就是z-score标准化。
  • 用Excel进行z-score标准化的方法:在Excel中没有现成的函数,需要自己分步计算,其实标准化的公式很简单。

步骤如下:
1.求出各变量(指标)的算术平均值(数学期望)xi和标准差si ;
2.进行标准化处理:
zij=(xij-xi)/si
其中:zij为标准化后的变量值;xij为实际变量值。
3.将逆指标前的正负号对调。
标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。


方法三:归一化方法

http://yuenshome.sinaapp.com/2014/08/三种常用数据标准化方法/

三种常用数据标准化方法相关推荐

  1. python代码规范化_数据标准化方法及其Python代码实现

    数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间.目前数据标准化方法有多种,归结起来可以分为直线型方法(如极值法.标准差法).折线型方法(如三折线法).曲线型方法 ...

  2. 常用的数据标准化方法

    数据的标准化(normalization)是将数据按照一定规则缩放,使之落入一个小的特定区间.这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权.其中最典型的 ...

  3. 【指数编制系列二】数据标准化方法

      在系统学习指数编制方法之前,先介绍一下几个指数编制过程中会经常使用的数据处理方法,如:数据标准化方法.权重设置方法.异常值处理方法.因为在后面指数编制过程中会经常用到这些方法.接下来我还是按照分类 ...

  4. 数据标准化方法z-score讲解(matlab)

    在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析. z-score 标准化(正太标准化)是基于原始数据的均值(mean)和标准差(standar ...

  5. 国家生物信息中心开发DNA甲基化芯片数据标准化方法—GMQN

    过去十年来,由于DNA甲基化芯片技术的不断发展以及测序成本的快速下降,DNA甲基化芯片数据呈现爆发式增长.这些数据是表观基因组关联研究(Epigenome-Wide Association Studi ...

  6. 常用两种数据标准化方法

    学习率 Learning Rate 本文从梯度学习算法的角度中看学习率对于学习算法性能的影响,以及介绍如何调整学习率的一般经验和技巧. 在机器学习中,监督式学习(Supervised Learning ...

  7. 数据标准化处理方法_机器学习系列-数据预处理-数据标准化(归一化)-理论

    在做一个具体的机器学习项目中,拿到收集到的数据后,一般都是需要做数据预处理,而标准化(暂时不考虑标准化和归一化的主要区别)是数据预处理中一个比较重要的环节,那么为什么需要对数据进行标准化处理呢? 数据 ...

  8. 数据标准化的原因和方法

    数据标准化的原因和方法 原因 由于不同变量常常具有不同的单位和不同的变异程度.   不同的单位常使系数的实践解释发生困难.例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出 ...

  9. 数据标准化的原因及方法

    一.为何要将数据标准化? 由于不同变量常常具有不同的单位和不同的变异程度.  不同的单位常使系数的实践解释发生困难.例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两 ...

  10. 数据预处理之标准化方法

    评价是现代社会各领域的一项经常性的工作,是科学做出管理决策的重要依据.随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单一指标对事物进行评价往往不尽合理,必须全面地从整体的角度考虑问题 ...

最新文章

  1. PyTorch 笔记(06)— Tensor 索引操作(index_select、masked_select、non_zero、gather)
  2. Oracle 10g RAC修改IP/VIP地址示例
  3. 十三、Redis五大数据类型之五Zset
  4. hdu 3416(最短路+最大流)
  5. expect 普通用户自动输入密码到root下,执行命令
  6. 以任务为向导建立系统的学习知识流程
  7. HH SaaS电商系统的商城模块设计
  8. String,StringBuffer,StringBuilder简单对比
  9. 【数据库题型大总结】简答题总结
  10. php是什么电荷,科学网—蛋白质的表面静电势、ζ-电位和表面电荷 - 朱俊向的博文...
  11. Java ---- baidu评价抽取关键词-商品评论
  12. axios发送网络请求
  13. 静态电子购物网站设计回忆
  14. 多语言国际版在线聊天室/匿名在线聊天室/语音聊天室/网页APP聊天室
  15. C语言实现反汇编【微机原理】
  16. An error occurred while starting the application
  17. 【数据结构】使用栈解决火车硬席(H)和软席(S)的调度问题
  18. swift学习二:基本的语法
  19. 老树发新芽—使用 mobx 加速你的 AngularJS 应用 1
  20. 硬件电路(3)设计篇----为什么栅极型推挽电路不用上P下N?

热门文章

  1. Python零基础爬虫速成②:批量爬取微信公众号图片(基于beautifulsoup爬取吉他谱)
  2. 微信小程序头像自动生成小程序源码
  3. RCC_APB2Periph_AFIO的理解。。。重映射的一点心得
  4. hi3519开发流程
  5. 笔试占比近40%,中国人民大学高瓴人工智能学院2022年夏令营来袭
  6. wps的ppt如何去掉插入表格的表头与表体之间的空白间隔
  7. python 拼音地名对应关系,Python使用百度地图API根据地名获取相应经纬度
  8. 服务器重装系统之DELL
  9. B站安卓端缓存的视频blv批量转换成完整MP4
  10. 中信银行c语言笔试题库,中信银行笔试IT类复习题参考资料带答案解析.doc