学习笔记,仅供参考


熵值法

信息熵介绍

信息熵是将系统无序程度的度量,信息是系统有序程度的度量,二者绝对值相等但符号相反,某项指标的指标值变异程度越大,信息熵就越小,该指标提供的信息量就越大,该指标的权重也应越大;反之,某项指标的指标值变异程度越小,信息熵越大,该指标提供的信息量越小,该指标的权重也应越小。

计算步骤

首先,我们由于指标体系中的各个指标的量纲、数量级不同,我们需要对它们进行无量纲化处理,具体方法如下:

Positiveindicators:xij′=xij−xminxmax−xminNegativeindex:xij′=xmax−xijxmax−xminPositive \; indicators:x'_{ij} = \frac{x_{ij}-x_{min}}{x_{max}-x_{min}} \\Negative \; index: x'_{ij} = \frac{x_{max}-x_{ij}}{x_{max}-x_{min}} Positiveindicators:xij′​=xmax​−xmin​xij​−xmin​​Negativeindex:xij′​=xmax​−xmin​xmax​−xij​​

其中,xijx_{ij}xij​为第iii个样本第jjj个指标的指标值,xmaxx_{max}xmax​为第jjj个指标的最大值,xminx_{min}xmin​为第jjj个指标的最小值,其中有mmm个样本,nnn个指标。

根据各项指标值的变异程度,利用信息熵工具,计算出各指标权重,具体步骤为:

  • 将各指标同度量化,计算第jjj项指标下第iii个样本指标值的比重

pij=xij∑i=1mxijp_{ij}= \frac{x_{ij}}{\sum_{i=1}^m x_{ij}} pij​=∑i=1m​xij​xij​​

  • 计算第jjj项指标的熵值eje_jej​

$$ e_j = -k \sum_{i=1}^m p_{ij}lnp_{ij} $$

其中,k>0k>0k>0,ej≥0e_j \ge 0ej​≥0,如果xijx_{ij}xij​对于给定的jjj全部相等。则pij=1mp_{ij}=\frac{1}{m}pij​=m1​,此时eje_jej​取极大值,即:

ej=−k∑i=1m1mln1m=klnme_j = -k \sum_{i=1}^m \frac{1}{m} ln \frac{1}{m} = klnm ej​=−ki=1∑m​m1​lnm1​=klnm

若设k=1lnmk=\frac{1}{lnm}k=lnm1​,于是有0≤ej≤10\le e_j \le 10≤ej​≤1.

  • 计算第jjj项指标的差异性系数gig_igi​

gj=1−ejg_j=1-e_j gj​=1−ej​

  • 对于差异性系数进行归一化,可计算出各指标的权重

wj=gj∑k=1mgkw_j = \frac{g_j}{\sum_{k=1}^m g_k} wj​=∑k=1m​gk​gj​​

数据挖掘学习日志(part1)--熵值法相关推荐

  1. matlab 值法确定各指标权重,Matlab学习系列19. 熵值法确定权重

    19. 熵值法确定权重 一.基本原理 在信息论中,熵是对不确定性的一种度量.信息量越大,不确定性就越小,熵也就越小:信息量越小,不确定性越大,熵也越大. 根据熵的特性,可以通过计算熵值来判断一个事件的 ...

  2. 数据挖掘学习日志(part2)--主成分法确定权重与R实现

    学习笔记,仅供参考,有错必纠 参考文献:基于主成分分析的指标权重确定方法–韩小孩; 主成分法确定权重 原理 构造样本阵 其中, x i j x_{ij} x

  3. 评价模型中熵值法Excel和Python实现

      因为项目需要,要用分数的形式评价用户对某个产品的喜好程度,其中的指标权重确定用熵值法计算.在网上搜集了些资料,再自己捣腾了一下分别用Excel和Python的方法来实现. 目录 一.熵值法介绍 二 ...

  4. 熵值法计算权重有异常值_指标权重确定方法 1-熵值法

    在信息论中,熵是对不确定性或随机性的一种度量,不确定性越大,熵值就越大,不确定性越小,熵值就越小.不确定性越大,表明随机性越大,数据越离散,则包含的信息就越大,在确定权重的时候往往就越小. 熵值法确定 ...

  5. df满足条件的值修改_如何用python实现熵值法求指标权重(实例)

    权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性.而在我们的数据分析过程中,倘若各个 ...

  6. 怎样计算权重?——层次分析法、熵值法:工具+数据+案例+代码

    1权重系数的计算 计算权重是一种常见的分析方法,在实际研究中,需要结合数据的特征情况进行选择,比如数据之间的波动性是一种信息量,那么可考虑使用CRITIC权重法或信息量权重法:也或者专家打分数据,那么 ...

  7. excel熵值法计算权重_指标权重确定方法 1-熵值法

    在信息论中,熵是对不确定性或随机性的一种度量,不确定性越大,熵值就越大,不确定性越小,熵值就越小.不确定性越大,表明随机性越大,数据越离散,则包含的信息就越大,在确定权重的时候往往就越小. 熵值法确定 ...

  8. 利用熵值法确定指标权重---原理及Python实现

    背景 在进行一些综合评估类项目时,需要给一些指标确定一个合理的权重,用来计算综合得分,这种综合评估类项目在实际的业务中有很多应用,比如:学生奖学金评定方法.广告效果综合评估.电视节目满意度综合评估.用 ...

  9. 基于面板数据的熵值法

    说明:对含年份.城市.指标的面板数据使用熵值法为各指标进行客观赋权,从而得出各城市的综合得分.本文对基于面板数据的熵值法公式做出解释并给出MATLAB代码实现. 公式理解1 Step1:指标选取.设有 ...

最新文章

  1. 力扣(LeetCode)刷题,简单+中等题(第26期)
  2. java中http解析url,java url 编码(解析http请求汉语言地址 )
  3. 15.大容量存储结构
  4. Navicat下载和破解以及使用
  5. Vue——[Props with type Object/Array must use a factory function to return the default value.]解决方案
  6. leetcode346. 数据流中的移动平均值
  7. 程序员必读的涨薪指南
  8. 智慧农业、数字农业、农产品交易、发布供应、采购详情、报价列表、交易订单、供应大厅、采购大厅、发布采购、采购需求、采购订单、在售商品、出售订单、账户中心、洽谈列表、入驻申请、Axure原型、农业数据看板
  9. npm install socket.io 提示缺少VCBuild.exe
  10. 飞鼠溪·狼(flying squirrel creek)-- BleedingWolves
  11. 车辆路径问题的基本操作
  12. XPS Silverlight Reader
  13. 苹果id无法登陆_《英雄联盟手游》苹果id和拳头账户合并教程 苹果id如何绑定拳头账号...
  14. 黑马程序员—黑马历程--我的人生,我的路--黑九的我毕业了
  15. bootstrap-table导出excel科学计数法bug,数字过长变成科学计数法
  16. 02组团队项目-Alpha冲刺-1/6
  17. 找准盈利模式,博客网站赚钱也轻松
  18. property of non-object,yii错误
  19. 34岁本科男,做了5年功能测试想转行,除了进厂还能干什么?
  20. 2021年G2电站锅炉司炉最新解析及G2电站锅炉司炉找解析

热门文章

  1. char[]和char*的区别(转)
  2. 子进程 已安装 post-installation 脚本 返回错误状态 4
  3. 一维卷积详细解释(转载+自己笔记)
  4. python怎么对齐文件_说说在 python 中,如何对齐文本
  5. JEPaas代码(SQL功能表)通过SQL功能表进行表查询
  6. 清华大学梁宸计算机系,2015年广东高考高等学校自主招生录取考生名单公示(2)...
  7. Myeclipse中weblogic配置
  8. top命令---Linux学习笔记
  9. mysql修改密码后phpmyadmin 出现#1045
  10. 解决kettle配置文件中的中文乱码