TOPSIS算法

英文全称Technique for Order Preference by Similarity to Ideal Solution，翻译为逼近理想解排序法。使用层次分析法进行评价时，n不能很大，最多就15个，再多就没有随机一致性指标RI的值了。当评价的对象比较多的时候，我们可以利用数据信息进行评价。

基本过程为先将原始数据矩阵统一指标类型（一般正向化处理）得到正向化的矩阵，再对正向化的矩阵进行标准化处理以消除各指标量纲的影响，并找到有限方案中的最优方案和最劣方案，然后分别计算各评价对象与最优方案和最劣方案间的距离，获得各评价对象与最优方案的相对接近程度，以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制，数据计算简单易行。

三种指标与正向化方法

极小型指标转化为极大型指标：max−xmax - xmax−x，或者 1/x1/x1/x
中间型指标转化为极大型指标：
首先得到距离最远的值：M=max⁡{∣xi−xbest∣}M = \max{\{|x_i - x_{best}|\}}M=max{∣xi−xbest∣}，然后计算该对象这个指标正向化后的值：xi~=1−∣xi−xbest∣M\tilde{x_i} = 1 - \frac{|x_i - x_{best}|}{M}xi~=1−M∣xi−xbest∣
区间型指标转化为极大型指标：
首先计算距离这个区间最远的值： M=max⁡{a−min⁡{xi},max⁡{xi}−b}M = \max\{a - \min{\{x_i}\}, \max\{x_i\}-b\}M=max{a−min{xi},max{xi}−b}
xi~=1−a−xiM,xi<a\tilde{x_i}= 1-\frac{a-x_i}{M},x_i<axi~=1−Ma−xi,xi<a
xi~=1,a<=xi<=b\tilde{x_i}= 1,a<=x_i<=bxi~=1,a<=xi<=b
xi~=1−xi−bM,xi>b\tilde{x_i}= 1-\frac{x_i-b}{M},x_i>bxi~=1−Mxi−b,xi>b

计算方法

（1）原始矩阵正向化
将矩阵中的极小型，中间型和区间型指标正向化为极大型指标
（2）正向化矩阵标准化
zij=xij/∑i=1nxij2z_{ij} = x_{ij}/\sqrt{\sum_{i=1}^n{x_{ij}^2}}zij=xij/∑i=1nxij2
也就是每一个元素/其所在列的元素平方和开平方
（3）计算得分和归一化排序

计算每一列的最大值 Z+Z^+Z+ 和最小值 Z−Z^-Z−
计算每个对象与最大值的距离D+D^+D+ 和最小值 D−D^-D−
得分：Si=Di−Di++Di−S_i = \frac{D^-_i}{D^+_i+D^-_i}Si=Di++Di−Di−
归一化：Si~=Si/∑i=1nSi\tilde{S_i} = S_i/\sum^n_{i=1}{S_i}Si~=Si/∑i=1nSi

代码

使用熵权法确定权重

clear;clc
load data_water_quality.mat%%  第二步：判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标'])
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理，需要请输入1 ，不需要输入0：  ']);if Judge == 1Position = input('请输入需要正向化处理的指标所在的列，例如第2、3、6三列需要处理，那么你需要输入[2,3,6]： '); %[2,3,4]disp('请输入需要处理的这些列的指标类型（1：极小型， 2：中间型， 3：区间型） ')Type = input('例如：第2列是极小型，第3列是区间型，第6列是中间型，就输入[1,3,2]：  '); %[2,1,3]% 注意，Position和Type是两个同维度的行向量for i = 1 : size(Position,2)  %这里需要对这些列分别处理X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));enddisp('正向化后的矩阵 X =  ')disp(X)
end%% 第三步：对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)%% 让用户判断是否需要增加权重
disp("请输入是否需要增加权重向量，需要输入1，不需要输入0")
Judge = input('请输入是否需要增加权重： ');
if Judge == 1Judge = input('使用熵权法确定权重请输入1，否则输入0： ');if Judge == 1if sum(sum(Z<0)) >0   % 如果之前标准化后的Z矩阵中存在负数，则重新对X进行标准化disp('原来标准化得到的Z矩阵中存在负数，所以需要对X重新标准化')for i = 1:nfor j = 1:mZ(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];endenddisp('X重新进行标准化得到的标准化矩阵Z为:  ')disp(Z)endweight = Entropy_Method(Z);disp('熵权法确定的权重为：')disp(weight)elsedisp(['如果你有3个指标，你就需要输入3个权重，例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);OK = 0;  % 用来判断用户的输入格式是否正确while OK == 0 if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m  % 注意，Matlab中浮点数的比较要小心OK =1;elseweight = input('你输入的有误，请重新输入权重行向量: ');endendend
elseweight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同，即都为1/m
end%% 第四步：计算与最大值的距离和最小值的距离，并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D+ 与最大值的距离向量
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N);    % 未归一化的得分
disp('最后的得分为：')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')

我更改后的Positivization文件代码：

function [change_x] = Positive_Change(src_x, type, index)
if type == 1 disp(['极小型的列：' num2str(index)]);change_x = max(src_x) - src_x;disp('----------极小型正向化完成----------')
elseif type == 2disp(['中间型的列：' num2str(index)]);best_num = input('请输入该指标最好的值：');M = max(abs(src_x - best_num));     % 得到距离最远的值change_x = 1 - abs(src_x - best_num)/M;disp('----------中间型正向化完成----------')
elseif type == 3disp(['区间型的列：' num2str(index)]);L = input('区间上界：');R = input('区间下界：');row_x = size(src_x, 1);M = max([L - min(src_x), max(src_x) - R]);for i = 1 : row_xif src_x(i) < L    % 距离上界的大小change_x(i) = 1 - (L - src_x(i)) / M;elseif src_x(i) > R % 距离下界的大小change_x(i) = 1 - (src_x(i) - R) / M;elsechange_x(i) = 1;endenddisp('----------区间型正向化完成----------')
elsedisp('类型输入错误!');
end
end

熵权法

层次分析法的权重大多是由自己确定的，主观性太强。熵权法是一种客观赋权方法，当数据变异程度越小，可以理解为方差越小，数据所含的信息越小，权重也就越低。常常使用差学生考生清华和好学生考上清华做为例子对比。

但是熵权法也有自己的弊端，对于一些极端情况，有些指标的变异程度虽然非常小，但是可能其权重很大，例如在评选奖学金的时候记档案次数和迟到次数，通过熵权法得到这两个指标的权值与实际常识不符。

信息熵

当越有可能发生的事情，信息量越小；当越不可能发生的事情，信息量越多。
我们使用概率表示事情发生的可能性大小，也就是概率与信息量呈反比，我们可以使用对数函数前加负号表示它们之间的关系。

设xxx为事件XXX发生的一种情况，这种情况发生的概率为p(x)p(x)p(x)，那么它的信息量可以定义为：I(x)=−ln⁡(p(x))I(x)=-\ln(p(x))I(x)=−ln(p(x))。如果事件XXX所有可能发生的情况为：x1,x2,...,xnx_1,x_2,...,x_nx1,x2,...,xn
那么事件XXX的信息熵可以定义为：
H(x)=∑i=1n[p(xi)I(xi)]=−∑i=1n[p(xi)ln⁡(p(xi))]H(x) = \sum^{n}_{i=1}{[p(x_i)I(x_i)]}=-\sum^{n}_{i=1}{[p(x_i)\ln(p(x_i))]}H(x)=∑i=1n[p(xi)I(xi)]=−∑i=1n[p(xi)ln(p(xi))]
可以看出信息熵其实是信息量的期望值。
当所有事件发生的情况概率相同时，信息熵最大（了解）

计算步骤

（1）首先对输入的矩阵进行正向化，对构成的正向化矩阵进行标准化得到矩阵ZZZ，ZZZ的元素：Zij=xij/∑i=1nxij2Z_{ij}=x_{ij}/\sqrt{\sum^{n}_{i=1}{x_{ij}^2}}Zij=xij/∑i=1nxij2
如果Z中存在负数，需要对XXX使用另一种标准化方法得到Z~\tilde{Z}Z~：
zij~=xij−min⁡{x1j,x2j,...xnj}max⁡{x1j,x2j,...xnj}−min⁡{x1j,x2j,...xnj}\tilde{z_{ij}}=\frac{x_{ij}-\min{\{x_{1j},x_{2j},...x_{nj}\}}}{\max{\{x_{1j},x_{2j},...x_{nj}\}}-\min{\{x_{1j},x_{2j},...x_{nj}\}}}zij~=max{x1j,x2j,...xnj}−min{x1j,x2j,...xnj}xij−min{x1j,x2j,...xnj}
即x减去这一列最小值除去这一列的最大值减最小值

（2）计算第jjj项指标下第i个样本的比重，将其看作相对熵计算中的概率
pij=zij~∑i=1nzij~p_{ij}=\frac{\tilde{z_{ij}}}{\sum^n_{i=1}{\tilde{z_{ij}}}}pij=∑i=1nzij~zij~

（3）计算每个指标的信息熵，并计算信息有效值，归一化得到每个指标的熵权
信息熵的计算公式：ej=−1ln⁡n∑i=1npijln⁡(pij)e_j = -\frac{1}{\ln{n}}\sum^n_{i=1}{p_{ij}\ln(p_{ij})}ej=−lnn1∑i=1npijln(pij)

当p(x1)=p(x2)=...=p(xn)=1np(x_1)=p(x_2)=...=p(x_n)=\frac{1}{n}p(x1)=p(x2)=...=p(xn)=n1时H(x)H(x)H(x)最大，此时H(x)=ln⁡nH(x)=\ln{n}H(x)=lnn，除以ln⁡n\ln{n}lnn可以使信息熵始终位于[0,1][0,1][0,1]上面。
当eje_{j}ej越大，j指标的信息熵越大，那么第j个指标所包含的信息越少，当H(x)H(x)H(x)取得最大值的时候p1j=p2j=...=pnjp_{1j}=p_{2j}=...=p_{nj}p1j=p2j=...=pnj，那么z1j~=z2j~=...=znj~\tilde{z_{1j}}=\tilde{z_{2j}}=...=\tilde{z_{nj}}z1j~=z2j~=...=znj~，即所有的指标值都相同，信息效用值最小。
信息效用值：dj=1−ejd_j=1-e_jdj=1−ej，当信息效用值越大，对应的信息越多。
我们将信息效用值进行归一化，就能得到每个指标的熵权：Wj=dj/∑j=1mdjW_j=d_j/\sum^m_{j=1}{d_j}Wj=dj/∑j=1mdj

代码

从得到标准化矩阵ZZZ开始

function [W] = Entropy_Method(Z)
% 计算有n个样本，m个指标的样本所对应的的熵权
% 输入
% Z ： n*m的矩阵（要经过正向化和标准化处理，且元素中不存在负数）
% 输出
% W：熵权，1*m的行向量%% 计算熵权[n,m] = size(Z);D = zeros(1,m);  % 初始化保存信息效用值的行向量for i = 1:mx = Z(:,i);  % 取出第i列的指标p = x / sum(x);% 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数e = -sum(p .* mylog(p)) / log(n); % 计算信息熵D(i) = 1- e; % 计算信息效用值endW = D ./ sum(D);  % 将信息效用值归一化，得到权重
end

TOPSIS算法与熵权法相关推荐

【建模算法】熵权法（Python实现）
[建模算法]熵权法(Python实现) 熵权法是通过寻找数据本身的规律来赋权重的一种方法. 熵是热力学单位,在数学中,信息熵表示事件所包含的信息量的期望.根据定义,对于某项指标,可以用熵值来判断某个指 ...
熵权法与Apriori算法对较多数据种类数据的处理
前言:前两天女朋友问我他们论文的时候看到他们用了基于熵权的TOPSIS模型做分析,由于本人没学过有关统计方面的知识,所以就去现学了一下.好巧不巧,在学校上课的时候老师提到了Apriori算法,突然联想 ...
TOPSIS和熵权法的应用（Matlab实现，包括数据预处理）
TOPSIS法是一种组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距. ①基本过程为归一化后的原始数据矩阵: ②采用余弦法找出有限方案中的最优方案和最劣方案:然后分别 ...
基于熵权法对TOPSIS法模型的修正
最近在学习数学建模,在B站发现一个特别不错的课程,讲的很全面,常考的算法都有涉及到:清风数学建模本文将结合熵权法介绍TOPSIS法,并将淡化原理的推导,更侧重于具体应用. TOPSIS法概述 TO ...
《零基础数学建模》——TOPSIS+熵权法
目录前言一.TOPSIS法(优劣解距离法) 1.模型原理 2.建模步骤二.模型实现第一步:将原始矩阵正向化第二步:正向化矩阵标准化第三步:计算得分并归一化四.TOPSIS模型的总结与 ...
数学建模笔记 Topsis和熵权法
Topsis法(Technique for Order Preference by Similarity to Ideal Solution)可翻译为逼近理想解排序法,国内常简称为优劣解距离法. ...
matlab 基于Topsis的熵权法2
基于Topsis的熵权法2 %%基于Topsis的熵权法代码 %% 熵权法部分 clc,clear; xij=xlsread('accessory1.xls','A','C2:IH147'); [ro ...
matlab 基于Topsis的熵权法
基于Topsis的熵权法 clc,clear; testData=xlsread('accessory1.xls','C2:IH403'); R=testData; [rows,cols]=size( ...
数学建模学习笔记（2）：TOPSIS方法（优劣解距离法）和熵权法修正
文章目录 TOPSIS方法概述 TOPSIS方法步骤(重点) 熵权法对TOPSIS模型的修正熵权法的步骤(重点) TOPSIS方法由C.L.Hwang和K.Yoon在1981年首次提出,在国内常简称 ...

TOPSIS算法与熵权法

TOPSIS算法

三种指标与正向化方法

计算方法

代码

熵权法

信息熵

计算步骤

代码

TOPSIS算法与熵权法相关推荐

最新文章

热门文章