0


评价类模型-基于熵权法的Topsis模型★★★★

该博客为个人学习清风建模的学习笔记,部分课程可以在B站:【强烈推荐】清风:数学建模算法、编程和写作培训的视频课程以及Matlab等软件教学_哔哩哔哩_bilibili

基于Topsis模型,本人写的笔记在:评价类模型-Topsis优劣解距离法-CSDN博客
名称重要性难度基于熵权法对Topsis模型的修正★★★★★★★

1引入

评价问题中标准矩阵引入,需要确定权重:

层次分析法可以进行权重确定,但是层次分析法有局限性。

层次分析法最大的缺点:判断矩阵的确定依赖于专家,如果专家的判断存在主观性的话,会对结果产生很大的影响。(主观性太强)

因此引入新的方法来确认权重——熵权法

2定义

2.1熵权法

**熵权法是一种客观赋权方法 **

依据的原理: 指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)

层次分析法的权重带有很重的主观色彩,而为了使权重更加客观,我们利用原始数据中的某些特性来确定权重。一列数据方差越小,指标的变异程度越小,所反映的信息量也越少,那么此时其权重就应该越低。而一列数据所反映的信息量越少,其信息熵就越大。所以指标的信息熵就是这样一个具有优良性质的特性。而且信息熵越大,权重就越低。(客观 = 数据本身就可以告诉我们权重)
​ 熵权法只是一个确定权重的方法,一般和别的方法(如TOPSIS法)一起使用。
————————————————

原文链接:https://blog.csdn.net/m0_63669388/article/details/132182382

变异程度可以理解为方差或标准差。

(一种极端的例子:对于所有的样本而言,这个指标都是相同的数值,那么我们可认为这个指标的权值为0,即这个指标对于我们的评价起不到任何帮助)

2.2度量信息量

举例引入:

    小张和小王是两个高中生。小张学习很差,而小王是全校前几名的尖子生。 

    高考结束后,小张和小王都考上了清华。小王考上了清华,大家都会觉得很正常,里 

面没什么信息量,因为学习好上清华,天经地义,本来就应该如此的事情。

    然而,如果是小张考上了清华,这就不一样了,这里面包含的信息量就非常大。怎么 

说?因为小张学习那么差,怎么会考上清华呢?把不可能的事情变成可能,这里面就有很

多信息量。

注:本例子来自微信公众号:“小宇治水 ”

上面的小例子告诉我们:

**越有可能发生的事情,信息量越少, ****越不可能发生的事情,信息量就越多。 **

**怎么衡量事情发生的可能性大小? **概率

函数关系确立:

2.3信息熵

信息熵的本质就是对信息量的期望值

随机变量的信息熵越大,则它的值(内容)能给你补充的信息量越大,而知道这个值前你已有的信息量越小。

对于熵权法而言,因为我们关注的是已有的信息,所以信息熵越大信息量越小

3步骤

(1)判断输入的矩阵中是否存在负数,如果有则要重新标准化到非负区间(后面计算概率时需要保证每一个元素为非负数

记得正向化、标准化!!

(2)计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率

标准化的值除以该列的和

(3)计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权

信息效用值越大,信息量越多;信息熵越大,信息量越少。

4原理

**熵权法是一种客观赋权方法 **

依据的原理: 指标的变异程度越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)

5代码

代码摘自清风老师

function [W] = Entropy_Method(Z)
% 计算有n个样本,m个指标的样本所对应的的熵权
% 输入
% Z : n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
% 输出
% W:熵权,1*m的行向量

%% 计算熵权
    [n,m] = size(Z);
    D = zeros(1,m);  % 初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i);  % 取出第i列的指标
        p = x / sum(x);
        % 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
        D(i) = 1- e; % 计算信息效用值
    end
    W = D ./ sum(D);  % 将信息效用值归一化,得到权重    
end
% 重新定义一个mylog函数,当输入的p中元素为0时,返回0
function [lnp] =  mylog(p)
n = length(p);   % 向量的长度
lnp = zeros(n,1);   % 初始化最后的结果
    for i = 1:n   % 开始循环
        if p(i) == 0   % 如果第i个元素为0
            lnp(i) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(i) = log(p(i));  
        end
    end
end

6总结

基于熵权法的Topsis模型是对Topsis模型的补充,因为层次分析法具有较大的主观色彩,对于最终得分来说,缺乏客观性,而熵权法是基于数据本身进行分析,所以更加推荐使用熵权法。使用步骤与Topsis模型差不多,但是引入新的指标——信息效用值来评价问题,将信息效用值归一化后,再计算对于的权重。熵权法只是一个确定权重的方法,一般和别的方法(如TOPSIS法)一起使用

局限性:1、基于数据本身,可能会与现实情况不合

           2、因为概率p是位于0‐1之间,因此需要对原始数据进行标准化,我们应该选择哪种方式进行标准化呢?查看知网的文献会发现,并没有约定俗成的标准,每个人的选取可能都不一样。是不同方式标准化得到的结果可能有很大差异,所以说熵权法也是存在着一定的问题的。

清风老师建议:如果大家的论文要发表,别用熵权法;如果大家只是用这个方法进行比赛,那么可以随便用,因为这个方法总比你自己随意定义好。


本文转载自: https://blog.csdn.net/huahua121_/article/details/140419296
版权归原作者 云上西 所有, 如有侵权,请联系我们删除。

“评价类模型-基于熵权法的Topsis模型★★★★”的评论:

还没有评论