0


评价类模型-基于熵权法的Topsis模型★★★★

该博客为个人学习清风建模的学习笔记,部分课程可以在B站:【强烈推荐】清风:数学建模算法、编程和写作培训的视频课程以及Matlab等软件教学_哔哩哔哩_bilibili

基于Topsis模型,本人写的笔记在:评价类模型-Topsis优劣解距离法-CSDN博客
名称重要性难度基于熵权法对Topsis模型的修正★★★★★★★

1引入

评价问题中标准矩阵引入,需要确定权重:

层次分析法可以进行权重确定,但是层次分析法有局限性。

层次分析法最大的缺点:判断矩阵的确定依赖于专家,如果专家的判断存在主观性的话,会对结果产生很大的影响。(主观性太强)

因此引入新的方法来确认权重——熵权法

2定义

2.1熵权法

**熵权法是一种客观赋权方法 **

依据的原理: 指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)

层次分析法的权重带有很重的主观色彩,而为了使权重更加客观,我们利用原始数据中的某些特性来确定权重。一列数据方差越小,指标的变异程度越小,所反映的信息量也越少,那么此时其权重就应该越低。而一列数据所反映的信息量越少,其信息熵就越大。所以指标的信息熵就是这样一个具有优良性质的特性。而且信息熵越大,权重就越低。(客观 = 数据本身就可以告诉我们权重)
​ 熵权法只是一个确定权重的方法,一般和别的方法(如TOPSIS法)一起使用。
————————————————

原文链接:https://blog.csdn.net/m0_63669388/article/details/132182382

变异程度可以理解为方差或标准差。

(一种极端的例子:对于所有的样本而言,这个指标都是相同的数值,那么我们可认为这个指标的权值为0,即这个指标对于我们的评价起不到任何帮助)

2.2度量信息量

举例引入:

  1. 小张和小王是两个高中生。小张学习很差,而小王是全校前几名的尖子生。
  2. 高考结束后,小张和小王都考上了清华。小王考上了清华,大家都会觉得很正常,里

面没什么信息量,因为学习好上清华,天经地义,本来就应该如此的事情。

  1. 然而,如果是小张考上了清华,这就不一样了,这里面包含的信息量就非常大。怎么

说?因为小张学习那么差,怎么会考上清华呢?把不可能的事情变成可能,这里面就有很

多信息量。

注:本例子来自微信公众号:“小宇治水 ”

上面的小例子告诉我们:

**越有可能发生的事情,信息量越少, ****越不可能发生的事情,信息量就越多。 **

**怎么衡量事情发生的可能性大小? **概率

函数关系确立:

2.3信息熵

信息熵的本质就是对信息量的期望值

随机变量的信息熵越大,则它的值(内容)能给你补充的信息量越大,而知道这个值前你已有的信息量越小。

对于熵权法而言,因为我们关注的是已有的信息,所以信息熵越大信息量越小

3步骤

(1)判断输入的矩阵中是否存在负数,如果有则要重新标准化到非负区间(后面计算概率时需要保证每一个元素为非负数

记得正向化、标准化!!

(2)计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率

标准化的值除以该列的和

(3)计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权

信息效用值越大,信息量越多;信息熵越大,信息量越少。

4原理

**熵权法是一种客观赋权方法 **

依据的原理: 指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)

5代码

代码摘自清风老师

  1. function [W] = Entropy_Method(Z)
  2. % 计算有n个样本,m个指标的样本所对应的的熵权
  3. % 输入
  4. % Z n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
  5. % 输出
  6. % W:熵权,1*m的行向量
  7. %% 计算熵权
  8. [n,m] = size(Z);
  9. D = zeros(1,m); % 初始化保存信息效用值的行向量
  10. for i = 1:m
  11. x = Z(:,i); % 取出第i列的指标
  12. p = x / sum(x);
  13. % 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数
  14. e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
  15. D(i) = 1- e; % 计算信息效用值
  16. end
  17. W = D ./ sum(D); % 将信息效用值归一化,得到权重
  18. end
  1. % 重新定义一个mylog函数,当输入的p中元素为0时,返回0
  2. function [lnp] = mylog(p)
  3. n = length(p); % 向量的长度
  4. lnp = zeros(n,1); % 初始化最后的结果
  5. for i = 1:n % 开始循环
  6. if p(i) == 0 % 如果第i个元素为0
  7. lnp(i) = 0; % 那么返回的第i个结果也为0
  8. else
  9. lnp(i) = log(p(i));
  10. end
  11. end
  12. end

6总结

基于熵权法的Topsis模型是对Topsis模型的补充,因为层次分析法具有较大的主观色彩,对于最终得分来说,缺乏客观性,而熵权法是基于数据本身进行分析,所以更加推荐使用熵权法。使用步骤与Topsis模型差不多,但是引入新的指标——信息效用值来评价问题,将信息效用值归一化后,再计算对于的权重。熵权法只是一个确定权重的方法,一般和别的方法(如TOPSIS法)一起使用

局限性:1、基于数据本身,可能会与现实情况不合

  1. 2、因为概率p是位于01之间,因此需要对原始数据进行标准化,我们应该选择哪种方式进行标准化呢?查看知网的文献会发现,并没有约定俗成的标准,每个人的选取可能都不一样。是不同方式标准化得到的结果可能有很大差异,所以说熵权法也是存在着一定的问题的。

清风老师建议:如果大家的论文要发表,别用熵权法;如果大家只是用这个方法进行比赛,那么可以随便用,因为这个方法总比你自己随意定义好。


本文转载自: https://blog.csdn.net/huahua121_/article/details/140419296
版权归原作者 云上西 所有, 如有侵权,请联系我们删除。

“评价类模型-基于熵权法的Topsis模型★★★★”的评论:

还没有评论