该博客为个人学习清风建模的学习笔记,部分课程可以在B站:【强烈推荐】清风:数学建模算法、编程和写作培训的视频课程以及Matlab等软件教学_哔哩哔哩_bilibili
基于Topsis模型,本人写的笔记在:评价类模型-Topsis优劣解距离法-CSDN博客
名称重要性难度基于熵权法对Topsis模型的修正★★★★★★★
1引入
评价问题中标准矩阵引入,需要确定权重:
层次分析法可以进行权重确定,但是层次分析法有局限性。
层次分析法最大的缺点:判断矩阵的确定依赖于专家,如果专家的判断存在主观性的话,会对结果产生很大的影响。(主观性太强)
因此引入新的方法来确认权重——熵权法。
2定义
2.1熵权法
**熵权法是一种客观赋权方法 **
依据的原理: 指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)
层次分析法的权重带有很重的主观色彩,而为了使权重更加客观,我们利用原始数据中的某些特性来确定权重。一列数据方差越小,指标的变异程度越小,所反映的信息量也越少,那么此时其权重就应该越低。而一列数据所反映的信息量越少,其信息熵就越大。所以指标的信息熵就是这样一个具有优良性质的特性。而且信息熵越大,权重就越低。(客观 = 数据本身就可以告诉我们权重)
熵权法只是一个确定权重的方法,一般和别的方法(如TOPSIS法)一起使用。
————————————————原文链接:https://blog.csdn.net/m0_63669388/article/details/132182382
变异程度可以理解为方差或标准差。
(一种极端的例子:对于所有的样本而言,这个指标都是相同的数值,那么我们可认为这个指标的权值为0,即这个指标对于我们的评价起不到任何帮助)
2.2度量信息量
举例引入:
小张和小王是两个高中生。小张学习很差,而小王是全校前几名的尖子生。 高考结束后,小张和小王都考上了清华。小王考上了清华,大家都会觉得很正常,里
面没什么信息量,因为学习好上清华,天经地义,本来就应该如此的事情。
然而,如果是小张考上了清华,这就不一样了,这里面包含的信息量就非常大。怎么
说?因为小张学习那么差,怎么会考上清华呢?把不可能的事情变成可能,这里面就有很
多信息量。
注:本例子来自微信公众号:“小宇治水 ”
上面的小例子告诉我们:
**越有可能发生的事情,信息量越少, ****越不可能发生的事情,信息量就越多。 **
**怎么衡量事情发生的可能性大小? **概率
函数关系确立:
2.3信息熵
信息熵的本质就是对信息量的期望值
随机变量的信息熵越大,则它的值(内容)能给你补充的信息量越大,而知道这个值前你已有的信息量越小。
对于熵权法而言,因为我们关注的是已有的信息,所以信息熵越大信息量越小。
3步骤
(1)判断输入的矩阵中是否存在负数,如果有则要重新标准化到非负区间(后面计算概率时需要保证每一个元素为非负数)
记得正向化、标准化!!
(2)计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率
标准化的值除以该列的和
(3)计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权
信息效用值越大,信息量越多;信息熵越大,信息量越少。
4原理
**熵权法是一种客观赋权方法 **
依据的原理: 指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)
5代码
代码摘自清风老师
function [W] = Entropy_Method(Z)
% 计算有n个样本,m个指标的样本所对应的的熵权
% 输入
% Z : n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
% 输出
% W:熵权,1*m的行向量
%% 计算熵权
[n,m] = size(Z);
D = zeros(1,m); % 初始化保存信息效用值的行向量
for i = 1:m
x = Z(:,i); % 取出第i列的指标
p = x / sum(x);
% 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数
e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D); % 将信息效用值归一化,得到权重
end
% 重新定义一个mylog函数,当输入的p中元素为0时,返回0
function [lnp] = mylog(p)
n = length(p); % 向量的长度
lnp = zeros(n,1); % 初始化最后的结果
for i = 1:n % 开始循环
if p(i) == 0 % 如果第i个元素为0
lnp(i) = 0; % 那么返回的第i个结果也为0
else
lnp(i) = log(p(i));
end
end
end
6总结
基于熵权法的Topsis模型是对Topsis模型的补充,因为层次分析法具有较大的主观色彩,对于最终得分来说,缺乏客观性,而熵权法是基于数据本身进行分析,所以更加推荐使用熵权法。使用步骤与Topsis模型差不多,但是引入新的指标——信息效用值来评价问题,将信息效用值归一化后,再计算对于的权重。熵权法只是一个确定权重的方法,一般和别的方法(如TOPSIS法)一起使用。
局限性:1、基于数据本身,可能会与现实情况不合
2、因为概率p是位于0‐1之间,因此需要对原始数据进行标准化,我们应该选择哪种方式进行标准化呢?查看知网的文献会发现,并没有约定俗成的标准,每个人的选取可能都不一样。是不同方式标准化得到的结果可能有很大差异,所以说熵权法也是存在着一定的问题的。
清风老师建议:如果大家的论文要发表,别用熵权法;如果大家只是用这个方法进行比赛,那么可以随便用,因为这个方法总比你自己随意定义好。
版权归原作者 云上西 所有, 如有侵权,请联系我们删除。