1.数据处理

在计算权值之前,需要对原始的数据进行一定的处理。

1.1 数据清洗

数据的清洗是解决问题的第一步,包括缺失值处理和异常值处理两方面。

对于缺失值,通常有三种可选的操作——删除、插补、不处理。其中插补的方式有很多,例如均值插补、固定值插补、最邻近插补、回归、插值(最常用)等等。

对于异常值,处理方法与缺失值没有太大区别。相比缺失值,异常值处理最主要的部分在于如何判断数据是否异常。异常值判断可以通过箱型图、小波分析等方式来进行。

1.2 数据变换

在进行数据变换之前,可以进行一些特征提取的工作,比如用PCA(主成分分析法)进行数据降维,得到独立的指标,这能够提高最终计算出的权值准确性。

根据不同的需要,数据变换的具体方式也不同,常见的有归一化、标准化等。

归一化:能够实现指标的一致化以及无量纲化。归一化操作针对不同类型的指标略有差异,但基本的原则是确定的,即把所有的指标转化为效益型指标。经过归一化后的数据相对均匀地分布在[0,1]区间内,相当于把数据压缩到0~1范围内。容易发现这个过程对于异常值是极度敏感的。

标准化:标准化后的数据,其均值为0,标准差为1。

个人感觉:归一化几乎是必做的,标准化、中心化等视具体情况而定。

不同方法的简单对比
 

图片来自:数据无量纲化处理(归一化VS标准化)

2. 三种赋权方法的比较

2.1 变异系数法

变异系数法,也叫标准离差法,基本思想是计算每个指标下数据的方差Si,用Si除以各个Si的总和作为第i个指标的权重值,方差越大者权重也越大

这种方法的优点是比较简单,也容易实现,能够有效区分各个指标。

但它的缺点也是显著的——变异系数法的前提是各个指标重要性相当。指标方差越大只能说明该指标对不同方案的区分度很高,事实上并不能等同于指标的重要度。因此使用变异系数法时,对指标的选取有一定要求。

2.2 熵权法

某种程度上与变异系数法很相似,但熵权法不是使用方差,而是用信息熵。

可参考这篇博客:熵权法_wenxin_titanium的博客-CSDN博客_熵权法

2.3 CRITIC

CRITIC的效果优于前两种方法,综合考虑了指标的对比强度与冲突性。但需要注意使用CRITIC则不宜进行标准化。

可参考这篇博客:客观赋权法——CRITIC权重法_卖山楂啦prss的博客-CSDN博客_critic法

三种客观赋权法——熵权法、变异系数法、CRITIC相关推荐

  1. 最常用的客观赋权方法——熵权法

    我们的征途是星辰大海,而并非烟尘人间. 文章目录 一.熵权法的原理 1.1 信息熵 1.2 熵权法 二.熵权法的主要步骤 2.1 数据标准化 2.2 求各指标在各方案下的比值 2.3 求各指标的信息熵 ...

  2. 建模笔记——熵值法熵权法(python)

    熵值法&熵权法-python实现 时隔老久,重新整理一下笔记.仅供个人自学使用,读者自行参考 Reference: 存了不知道多久的本地文件 司守奎,python数学实验与建模,2020 ht ...

  3. 多目标决策问题1.1.1:线性加权法——熵权法确定权重

    多目标决策问题是目前数学建模中比较普遍的一类问题, 此类问题要求我们满足多个目标函数最优与决策变量的线性约束条件或非线性约束条件下进行求解, 多目标决策问题主要有主要目标法.线性加权法.分层序列法.步 ...

  4. 计算梯度的三种方法: 数值法,解析法,反向传播法

    # coding=gbk""" function : f(x,y,z) = (x+y)z """ # first method 解析法 de ...

  5. 用matlab实现熵权法,熵权法原理及matlab代码实现

    参考原理博客地址https://blog.csdn.net/u013713294/article/details/53407087 一.基本原理 在信息论中,熵是对不确定性的一种度量.信息量越大,不确 ...

  6. 三种编程命名规则(匈牙利法,小驼峰法,大驼峰法)

    1. 匈牙利命名: 开头字母用变量类型的缩写,其余部分用变量的英文或英文的缩写,要求单词第一个字母大写. eg: long lsum = 0;"l"是类型的缩写: 2. 小驼峰式: ...

  7. 权重设计:客观赋权法的说明(熵权法/变异系数法/CRCIII法/TOPSIS法)

    在数据分析中,我们经常会遇到多个特征对于结果造成不同影响的情况,如何识别这些特征各自的权重,对我们的后续结果评估,打分矩阵构建都具有重要意义.我们所说的赋权法是用于解决多指标综合评价问题中的各指标权重 ...

  8. 基于层次分析法与熵权法的主客观组合赋权模型(原创:小青龙)

    基于层次分析法与熵权法的主客观组合赋权模型 组合赋权大家可以尝试进行改变,一个主观一个客观.(原创:小青龙) 简介 ​ 权重是用来衡量总体中各单位标志值在总体中作用大小的数值, 用来描述单因子在因子集 ...

  9. 客观赋权法——变异系数法

    一.变异系数法的概念 变异系数法是根据统计学方法计算得出系统各指标变化程度的方法,是一种客观赋权法. 根据该方法变化差异较大的指标权重较大,变化差异较小的指标权重较小,从而根据指标的统计学规律确定其重 ...

最新文章

  1. 2020年全国信息安全标准化技术委员会大数据安全标准特别工作组全体会议即将召开...
  2. jvm性能调优 - 15JVM的老年代垃圾回收器CMS的缺点
  3. jQuery 插件 输入框focus效果 编写自己的插件
  4. 【写实与风格化】技术概述
  5. 设计模式原则总结--读《大话设计模式》有感 转
  6. linux yum自动挂载_Linux运维——升级系统相关漏洞
  7. 达摩院研发自动驾驶高精定位系统,无GPS信号也可实现厘米级定位
  8. openresty的安装和使用
  9. Java将hive数据导入到hdfs_sqoop数据导入到Hdfs 或者hive
  10. mysql 两表关联更新sql
  11. MyBatis3简介
  12. c语言的异步回调函数,C语言函数的回调函数
  13. 千万不要用memset函数对二维数组进行初始化
  14. maven依赖名词解释
  15. redis未授权访问漏洞
  16. LVS+Keepalived高可用
  17. 机器学习小组知识点31:重要性采样(Importance Sampling )
  18. 【收藏】最全计算机网络基础思维导图
  19. 四款小众实用的办公神器软件,值得你去收藏
  20. 互联网下半场的网络效应

热门文章

  1. 写一个垃圾桶开关盖子的动画其实很简单
  2. Making the Grade
  3. Android grade语法,多渠道打包
  4. java quickfix_QuickFix/J
  5. windows系统下:连接共享打印机报错(错误代码0x0000007c)
  6. 柱纵向钢筋长度计算机械连接,按11G101-1图集必须采用机械连接的钢筋直径大小是多少...
  7. 阿里云携手瑞云科技加入全球视觉云计算战局
  8. Java初学者作业——输入一个五位数字,计算各位数字之和并输出,运行结果为五个数字之和(实践2)
  9. 【财富空间】一个人真正的资本是什么
  10. 三洋服务器r系列和q系列区别,【经验分析】三菱Q系列和FX PLC系列的区别