评价类模型-基于熵权法的Topsis模型★★★★

该博客为个人学习清风建模的学习笔记，部分课程可以在B站：【强烈推荐】清风：数学建模算法、编程和写作培训的视频课程以及Matlab等软件教学_哔哩哔哩_bilibili

基于Topsis模型，本人写的笔记在：评价类模型-Topsis优劣解距离法-CSDN博客
名称重要性难度基于熵权法对Topsis模型的修正★★★★★★★

1引入

评价问题中标准矩阵引入，需要确定权重：

层次分析法可以进行权重确定，但是层次分析法有局限性。

层次分析法最大的缺点：判断矩阵的确定依赖于专家，如果专家的判断存在主观性的话，会对结果产生很大的影响。（主观性太强）

因此引入新的方法来确认权重——熵权法。

2定义

2.1熵权法

**熵权法是一种客观赋权方法 **

依据的原理： 指标的变异程度越小，所反映的信息量也越少，其对应的权值也应该越低。（客观 = 数据本身就可以告诉我们权重）

层次分析法的权重带有很重的主观色彩，而为了使权重更加客观，我们利用原始数据中的某些特性来确定权重。一列数据方差越小，指标的变异程度越小，所反映的信息量也越少，那么此时其权重就应该越低。而一列数据所反映的信息量越少，其信息熵就越大。所以指标的信息熵就是这样一个具有优良性质的特性。而且信息熵越大，权重就越低。（客观 = 数据本身就可以告诉我们权重）
熵权法只是一个确定权重的方法，一般和别的方法（如TOPSIS法）一起使用。
————————————————

原文链接：https://blog.csdn.net/m0_63669388/article/details/132182382

变异程度可以理解为方差或标准差。

（一种极端的例子：对于所有的样本而言，这个指标都是相同的数值，那么我们可认为这个指标的权值为0，即这个指标对于我们的评价起不到任何帮助）

2.2度量信息量

举例引入：

    小张和小王是两个高中生。小张学习很差，而小王是全校前几名的尖子生。 

    高考结束后，小张和小王都考上了清华。小王考上了清华，大家都会觉得很正常，里 
面没什么信息量，因为学习好上清华，天经地义，本来就应该如此的事情。
    然而，如果是小张考上了清华，这就不一样了，这里面包含的信息量就非常大。怎么 
说？因为小张学习那么差，怎么会考上清华呢？把不可能的事情变成可能，这里面就有很

多信息量。

注：本例子来自微信公众号：“小宇治水 ”

上面的小例子告诉我们：

**越有可能发生的事情，信息量越少， ****越不可能发生的事情，信息量就越多。 **

**怎么衡量事情发生的可能性大小？ **概率

函数关系确立：

2.3信息熵

信息熵的本质就是对信息量的期望值

随机变量的信息熵越大，则它的值(内容)能给你补充的信息量越大，而知道这个值前你已有的信息量越小。

对于熵权法而言，因为我们关注的是已有的信息，所以信息熵越大信息量越小。

3步骤

（1）判断输入的矩阵中是否存在负数，如果有则要重新标准化到非负区间（后面计算概率时需要保证每一个元素为非负数）

记得正向化、标准化！！

（2）计算第j项指标下第i个样本所占的比重，并将其看作相对熵计算中用到的概率

标准化的值除以该列的和

（3）计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权

信息效用值越大，信息量越多；信息熵越大，信息量越少。

4原理

**熵权法是一种客观赋权方法 **

依据的原理： 指标的变异程度越小，所反映的信息量也越少，其对应的权值也应该越低。（客观 = 数据本身就可以告诉我们权重）

5代码

代码摘自清风老师

function [W] = Entropy_Method(Z)
% 计算有n个样本，m个指标的样本所对应的的熵权
% 输入
% Z ： n*m的矩阵（要经过正向化和标准化处理，且元素中不存在负数）
% 输出
% W：熵权，1*m的行向量

%% 计算熵权
    [n,m] = size(Z);
    D = zeros(1,m);  % 初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i);  % 取出第i列的指标
        p = x / sum(x);
        % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
        D(i) = 1- e; % 计算信息效用值
    end
    W = D ./ sum(D);  % 将信息效用值归一化，得到权重    
end

% 重新定义一个mylog函数，当输入的p中元素为0时，返回0
function [lnp] =  mylog(p)
n = length(p);   % 向量的长度
lnp = zeros(n,1);   % 初始化最后的结果
    for i = 1:n   % 开始循环
        if p(i) == 0   % 如果第i个元素为0
            lnp(i) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(i) = log(p(i));  
        end
    end
end

6总结

基于熵权法的Topsis模型是对Topsis模型的补充，因为层次分析法具有较大的主观色彩，对于最终得分来说，缺乏客观性，而熵权法是基于数据本身进行分析，所以更加推荐使用熵权法。使用步骤与Topsis模型差不多，但是引入新的指标——信息效用值来评价问题，将信息效用值归一化后，再计算对于的权重。熵权法只是一个确定权重的方法，一般和别的方法（如TOPSIS法）一起使用。

局限性：1、基于数据本身，可能会与现实情况不合

           2、因为概率p是位于0‐1之间，因此需要对原始数据进行标准化，我们应该选择哪种方式进行标准化呢？查看知网的文献会发现，并没有约定俗成的标准，每个人的选取可能都不一样。是不同方式标准化得到的结果可能有很大差异，所以说熵权法也是存在着一定的问题的。

清风老师建议：如果大家的论文要发表，别用熵权法；如果大家只是用这个方法进行比赛，那么可以随便用，因为这个方法总比你自己随意定义好。

标签：数学建模 python 机器学习

本文转载自: https://blog.csdn.net/huahua121_/article/details/140419296
版权归原作者 云上西 所有，如有侵权，请联系我们删除。

评价类模型-基于熵权法的Topsis模型★★★★

1引入

2定义

2.1熵权法

2.2度量信息量

2.3信息熵

3步骤

4原理

5代码

6总结

发表评论

“评价类模型-基于熵权法的Topsis模型★★★★”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航