TOPSIS算法

英文全称Technique for Order Preference by Similarity to Ideal Solution,翻译为逼近理想解排序法。使用层次分析法进行评价时,n不能很大,最多就15个,再多就没有随机一致性指标RI的值了。当评价的对象比较多的时候,我们可以利用数据信息进行评价。

基本过程为先将原始数据矩阵统一指标类型(一般正向化处理)得到正向化的矩阵,再对正向化的矩阵进行标准化处理以消除各指标量纲的影响,并找到有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行。

三种指标与正向化方法

  • 极小型指标转化为极大型指标:max−xmax - xmax−x,或者 1/x1/x1/x
  • 中间型指标转化为极大型指标:
    首先得到距离最远的值:M=max⁡{∣xi−xbest∣}M = \max{\{|x_i - x_{best}|\}}M=max{∣xi​−xbest​∣},然后计算该对象这个指标正向化后的值:xi~=1−∣xi−xbest∣M\tilde{x_i} = 1 - \frac{|x_i - x_{best}|}{M}xi​~​=1−M∣xi​−xbest​∣​
  • 区间型指标转化为极大型指标:
    首先计算距离这个区间最远的值: M=max⁡{a−min⁡{xi},max⁡{xi}−b}M = \max\{a - \min{\{x_i}\}, \max\{x_i\}-b\}M=max{a−min{xi​},max{xi​}−b}
    xi~=1−a−xiM,xi<a\tilde{x_i}= 1-\frac{a-x_i}{M},x_i<axi​~​=1−Ma−xi​​,xi​<a
    xi~=1,a<=xi<=b\tilde{x_i}= 1,a<=x_i<=bxi​~​=1,a<=xi​<=b
    xi~=1−xi−bM,xi>b\tilde{x_i}= 1-\frac{x_i-b}{M},x_i>bxi​~​=1−Mxi​−b​,xi​>b

计算方法

(1)原始矩阵正向化
将矩阵中的极小型,中间型和区间型指标正向化为极大型指标
(2)正向化矩阵标准化
zij=xij/∑i=1nxij2z_{ij} = x_{ij}/\sqrt{\sum_{i=1}^n{x_{ij}^2}}zij​=xij​/∑i=1n​xij2​​
也就是每一个元素/其所在列的元素平方和开平方
(3)计算得分和归一化排序

  • 计算每一列的最大值 Z+Z^+Z+ 和最小值 Z−Z^-Z−
  • 计算每个对象与最大值的距离D+D^+D+ 和最小值 D−D^-D−
  • 得分:Si=Di−Di++Di−S_i = \frac{D^-_i}{D^+_i+D^-_i}Si​=Di+​+Di−​Di−​​
  • 归一化:Si~=Si/∑i=1nSi\tilde{S_i} = S_i/\sum^n_{i=1}{S_i}Si​~​=Si​/∑i=1n​Si​

代码

使用熵权法确定权重

clear;clc
load data_water_quality.mat%%  第二步:判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标'])
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0:  ']);if Judge == 1Position = input('请输入需要正向化处理的指标所在的列,例如第2、3、6三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]disp('请输入需要处理的这些列的指标类型(1:极小型, 2:中间型, 3:区间型) ')Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]:  '); %[2,1,3]% 注意,Position和Type是两个同维度的行向量for i = 1 : size(Position,2)  %这里需要对这些列分别处理X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));enddisp('正向化后的矩阵 X =  ')disp(X)
end%% 第三步:对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)%% 让用户判断是否需要增加权重
disp("请输入是否需要增加权重向量,需要输入1,不需要输入0")
Judge = input('请输入是否需要增加权重: ');
if Judge == 1Judge = input('使用熵权法确定权重请输入1,否则输入0: ');if Judge == 1if sum(sum(Z<0)) >0   % 如果之前标准化后的Z矩阵中存在负数,则重新对X进行标准化disp('原来标准化得到的Z矩阵中存在负数,所以需要对X重新标准化')for i = 1:nfor j = 1:mZ(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];endenddisp('X重新进行标准化得到的标准化矩阵Z为:  ')disp(Z)endweight = Entropy_Method(Z);disp('熵权法确定的权重为:')disp(weight)elsedisp(['如果你有3个指标,你就需要输入3个权重,例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);OK = 0;  % 用来判断用户的输入格式是否正确while OK == 0 if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m  % 注意,Matlab中浮点数的比较要小心OK =1;elseweight = input('你输入的有误,请重新输入权重行向量: ');endendend
elseweight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同,即都为1/m
end%% 第四步:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D+ 与最大值的距离向量
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N);    % 未归一化的得分
disp('最后的得分为:')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')

我更改后的Positivization文件代码:

function [change_x] = Positive_Change(src_x, type, index)
if type == 1 disp(['极小型的列:' num2str(index)]);change_x = max(src_x) - src_x;disp('----------极小型正向化完成----------')
elseif type == 2disp(['中间型的列:' num2str(index)]);best_num = input('请输入该指标最好的值:');M = max(abs(src_x - best_num));     % 得到距离最远的值change_x = 1 - abs(src_x - best_num)/M;disp('----------中间型正向化完成----------')
elseif type == 3disp(['区间型的列:' num2str(index)]);L = input('区间上界:');R = input('区间下界:');row_x = size(src_x, 1);M = max([L - min(src_x), max(src_x) - R]);for i = 1 : row_xif src_x(i) < L    % 距离上界的大小change_x(i) = 1 - (L - src_x(i)) / M;elseif src_x(i) > R % 距离下界的大小change_x(i) = 1 - (src_x(i) - R) / M;elsechange_x(i) = 1;endenddisp('----------区间型正向化完成----------')
elsedisp('类型输入错误!');
end
end

熵权法

层次分析法的权重大多是由自己确定的,主观性太强。熵权法是一种客观赋权方法,当数据变异程度越小,可以理解为方差越小,数据所含的信息越小,权重也就越低。常常使用差学生考生清华和好学生考上清华做为例子对比。

但是熵权法也有自己的弊端,对于一些极端情况,有些指标的变异程度虽然非常小,但是可能其权重很大,例如在评选奖学金的时候记档案次数和迟到次数,通过熵权法得到这两个指标的权值与实际常识不符。

信息熵

当越有可能发生的事情,信息量越小;当越不可能发生的事情,信息量越多。
我们使用概率表示事情发生的可能性大小,也就是概率与信息量呈反比,我们可以使用对数函数前加负号表示它们之间的关系。

设xxx为事件XXX发生的一种情况,这种情况发生的概率为p(x)p(x)p(x),那么它的信息量 可以定义为:I(x)=−ln⁡(p(x))I(x)=-\ln(p(x))I(x)=−ln(p(x))。如果事件XXX所有可能发生的情况为:x1,x2,...,xnx_1,x_2,...,x_nx1​,x2​,...,xn​
那么事件XXX的信息熵可以定义为:
H(x)=∑i=1n[p(xi)I(xi)]=−∑i=1n[p(xi)ln⁡(p(xi))]H(x) = \sum^{n}_{i=1}{[p(x_i)I(x_i)]}=-\sum^{n}_{i=1}{[p(x_i)\ln(p(x_i))]}H(x)=∑i=1n​[p(xi​)I(xi​)]=−∑i=1n​[p(xi​)ln(p(xi​))]
可以看出信息熵其实是信息量的期望值。
当所有事件发生的情况概率相同时,信息熵最大(了解)

计算步骤

(1)首先对输入的矩阵进行正向化,对构成的正向化矩阵进行标准化得到矩阵ZZZ,ZZZ的元素:Zij=xij/∑i=1nxij2Z_{ij}=x_{ij}/\sqrt{\sum^{n}_{i=1}{x_{ij}^2}}Zij​=xij​/∑i=1n​xij2​​
如果Z中存在负数,需要对XXX使用另一种标准化方法得到Z~\tilde{Z}Z~:
zij~=xij−min⁡{x1j,x2j,...xnj}max⁡{x1j,x2j,...xnj}−min⁡{x1j,x2j,...xnj}\tilde{z_{ij}}=\frac{x_{ij}-\min{\{x_{1j},x_{2j},...x_{nj}\}}}{\max{\{x_{1j},x_{2j},...x_{nj}\}}-\min{\{x_{1j},x_{2j},...x_{nj}\}}}zij​~​=max{x1j​,x2j​,...xnj​}−min{x1j​,x2j​,...xnj​}xij​−min{x1j​,x2j​,...xnj​}​
即x减去这一列最小值除去这一列的最大值减最小值

(2)计算第jjj项指标下第i个样本的比重,将其看作相对熵计算中的概率
pij=zij~∑i=1nzij~p_{ij}=\frac{\tilde{z_{ij}}}{\sum^n_{i=1}{\tilde{z_{ij}}}}pij​=∑i=1n​zij​~​zij​~​​

(3)计算每个指标的信息熵,并计算信息有效值,归一化得到每个指标的熵权
信息熵的计算公式:ej=−1ln⁡n∑i=1npijln⁡(pij)e_j = -\frac{1}{\ln{n}}\sum^n_{i=1}{p_{ij}\ln(p_{ij})}ej​=−lnn1​∑i=1n​pij​ln(pij​)

  • 当p(x1)=p(x2)=...=p(xn)=1np(x_1)=p(x_2)=...=p(x_n)=\frac{1}{n}p(x1​)=p(x2​)=...=p(xn​)=n1​时H(x)H(x)H(x)最大,此时H(x)=ln⁡nH(x)=\ln{n}H(x)=lnn,除以ln⁡n\ln{n}lnn可以使信息熵始终位于[0,1][0,1][0,1]上面。
  • 当eje_{j}ej​越大,j指标的信息熵越大,那么第j个指标所包含的信息越少,当H(x)H(x)H(x)取得最大值的时候p1j=p2j=...=pnjp_{1j}=p_{2j}=...=p_{nj}p1j​=p2j​=...=pnj​,那么z1j~=z2j~=...=znj~\tilde{z_{1j}}=\tilde{z_{2j}}=...=\tilde{z_{nj}}z1j​~​=z2j​~​=...=znj​~​,即所有的指标值都相同,信息效用值最小。
  • 信息效用值:dj=1−ejd_j=1-e_jdj​=1−ej​,当信息效用值越大,对应的信息越多。
  • 我们将信息效用值进行归一化,就能得到每个指标的熵权:Wj=dj/∑j=1mdjW_j=d_j/\sum^m_{j=1}{d_j}Wj​=dj​/∑j=1m​dj​

代码

从得到标准化矩阵ZZZ开始

function [W] = Entropy_Method(Z)
% 计算有n个样本,m个指标的样本所对应的的熵权
% 输入
% Z : n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
% 输出
% W:熵权,1*m的行向量%% 计算熵权[n,m] = size(Z);D = zeros(1,m);  % 初始化保存信息效用值的行向量for i = 1:mx = Z(:,i);  % 取出第i列的指标p = x / sum(x);% 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数e = -sum(p .* mylog(p)) / log(n); % 计算信息熵D(i) = 1- e; % 计算信息效用值endW = D ./ sum(D);  % 将信息效用值归一化,得到权重
end

TOPSIS算法与熵权法相关推荐

  1. 【建模算法】熵权法(Python实现)

    [建模算法]熵权法(Python实现) 熵权法是通过寻找数据本身的规律来赋权重的一种方法. 熵是热力学单位,在数学中,信息熵表示事件所包含的信息量的期望.根据定义,对于某项指标,可以用熵值来判断某个指 ...

  2. 熵权法与Apriori算法对较多数据种类数据的处理

    前言:前两天女朋友问我他们论文的时候看到他们用了基于熵权的TOPSIS模型做分析,由于本人没学过有关统计方面的知识,所以就去现学了一下.好巧不巧,在学校上课的时候老师提到了Apriori算法,突然联想 ...

  3. TOPSIS和熵权法的应用(Matlab实现,包括数据预处理)

    TOPSIS法是一种组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距. ①基本过程为归一化后的原始数据矩阵: ②采用余弦法找出有限方案中的最优方案和最劣方案:然后分别 ...

  4. 基于熵权法对TOPSIS法模型的修正

    最近在学习数学建模,在B站发现一个特别不错的课程,讲的很全面,常考的算法都有涉及到:清风数学建模 本文将结合熵权法介绍TOPSIS法,并将淡化原理的推导,更侧重于具体应用. TOPSIS法 概述 TO ...

  5. 《零基础数学建模》——TOPSIS+熵权法

    目录 ​ 前言 一.TOPSIS法(优劣解距离法) 1.模型原理 2.建模步骤 二.模型实现 第一步:将原始矩阵正向化 第二步:正向化矩阵标准化 第三步:计算得分并归一化 四.TOPSIS模型的总结与 ...

  6. 数学建模笔记 Topsis和熵权法

    Topsis法(Technique for Order Preference by Similarity to Ideal Solution)可翻译为逼近理想解排序法,国内常简称为优劣解距离法. ​ ...

  7. matlab 基于Topsis的熵权法2

    基于Topsis的熵权法2 %%基于Topsis的熵权法代码 %% 熵权法部分 clc,clear; xij=xlsread('accessory1.xls','A','C2:IH147'); [ro ...

  8. matlab 基于Topsis的熵权法

    基于Topsis的熵权法 clc,clear; testData=xlsread('accessory1.xls','C2:IH403'); R=testData; [rows,cols]=size( ...

  9. 数学建模学习笔记(2):TOPSIS方法(优劣解距离法)和熵权法修正

    文章目录 TOPSIS方法概述 TOPSIS方法步骤(重点) 熵权法对TOPSIS模型的修正 熵权法的步骤(重点) TOPSIS方法由C.L.Hwang和K.Yoon在1981年首次提出,在国内常简称 ...

最新文章

  1. sklearn朴素贝叶斯分类器_朴素贝叶斯原理
  2. PyCharm——turtle库的画布悬停解决方案
  3. Java Web 九大内置对象(一)
  4. java基础 通过继承Thread类和实现Runnable接口创建线程
  5. Java中try、finally语句中有return时的执行情况
  6. 1038. 统计同成绩学生(20)-PAT乙级真题
  7. mpfr-3.1.0编译方法
  8. 关于cuda驱动版本以及cuda运行版本不匹配的问题
  9. 硬核!自动驾驶如何做数据标注?特斯拉EP3 Auto Labeling深度分析
  10. 微信小程序----开发小技巧(二)
  11. python编写篮球_资深程序员教你,利用python预测NBA比赛结果,太精彩了
  12. 科技巨头们在SaaS市场“雷声大雨点小”背后的症结
  13. Voxel RCNN:高性能3D目标检测网络(AAAI2021)
  14. AUTOSAR技术分析报告
  15. 学习通、优课联盟不让粘贴?那就让计算机帮你手打!
  16. Mitmproxy/mitmdump中文文档以及配置教程
  17. 四则运算web版需求规格说明书
  18. c语言序数英文,(英语 )序数词第一至40怎么写序数词第一至40怎么写?谁帮个忙...
  19. lookUpEdit隐藏列
  20. 系统管理员设置了系统策略,禁止进行此安装。

热门文章

  1. 数据科学、管理科学系课程教学课件——FineReport实验指导书节选====港口生产运行情况
  2. c语言mpi并行程序,高性能计算之并行编程技术MPI并行程序设计(完整版).pdf
  3. wsm在html中设置td高度无效,td为什么设置了宽度却无效
  4. c语言等要空心梯形代码,C语言空心菱形 *号打印图形
  5. c语言0xa9错误,16种C语言编译警告(Warning)类型的解决方法
  6. ElasticSearch教程——cardinality(去重)算法之优化内存开销以及HLL算法
  7. matlab图像校正工具箱_相机标定简介与MatLab相机标定工具箱的使用(未涉及原理公式推导)...
  8. 这10 个工具,让你效率提升
  9. 关于2023年度PMI认证考试计划的通知
  10. 纯国产化易灵思T20核心板