熵权法在多属性决策中的应用与实现-CSDN博客

1. 多属性决策：当选择困难症遇上“硬核”数学

你有没有遇到过这种情况？想买台新电脑，看着一堆参数：CPU、内存、硬盘、显卡、屏幕、价格……每个都重要，但预算有限，到底该优先考虑哪个？或者，公司要选个供应商，得综合评估价格、质量、交货期、售后服务好几个方面，怎么才能公平地给这些因素打分，做出最合理的决定？

这其实就是典型的多属性决策问题。我们生活里充满了这种“既要、又要、还要”的纠结时刻。以前，我们可能凭感觉，或者简单粗暴地给每个因素随便定个权重，比如“价格最重要，占50%”。但这么做主观性太强了，你说价格占50%，我说质量占60%，谁也说服不了谁，最后往往变成“拍脑袋”决策。

这时候，就需要一种更“客观”、更“讲道理”的方法来帮我们确定各个属性的重要性。今天我要跟你聊的熵权法，就是这样一个从数据自身出发，让数据“自己说话”，告诉我们哪个属性更关键的数学工具。它不依赖任何人的主观判断，完全基于你手头数据的“混乱”程度来分配权重，特别适合处理那些指标繁多、量纲不一、让人眼花缭乱的评价体系。我做过不少项目评估和方案优选，用熵权法来打底，再做决策，心里踏实多了。

2. 熵与信息熵：从“热力学”到“信息论”的跨界明星

要搞懂熵权法，咱们得先聊聊它的核心——“熵”。这个词听起来有点玄乎，其实它是个“跨界”概念。

最早，“熵”是物理学里的一个概念，由克劳修斯在1865年提出，用来描述一个系统的“混乱”或者“无序”程度。有个著名的“热力学第二定律”，也叫“熵增定律”，说的是：在一个孤立系统里，事情总是自发地朝着越来越混乱、越来越无序的方向发展。比如，你的房间如果不收拾，只会越来越乱；一杯热水和一杯冷水混在一起，最终会变成一杯温水，而不会再自动分开。这个从有序到无序的过程，就是熵在增加。

后来，信息论之父香农把这个概念“借”到了通信领域，提出了信息熵。在信息论里，信息熵用来衡量信息的不确定性或者“惊喜”程度。怎么理解呢？

我举个简单的例子。你朋友告诉你：“明天太阳会从东边升起。”这句话的信息量几乎为零，因为这是确定无疑的事，没有任何不确定性，所以它的信息熵很低。但如果他告诉你：“明天会中彩票头奖。”这句话就充满了不确定性，如果真的发生了，会给你带来巨大“惊喜”，所以这句话蕴含的信息熵就很高。

用数学公式来说，对于一个有n种可能结果的随机事件，每个结果出现的概率是 p_i，那么它的信息熵 H 就是：

H = - Σ (p_i * log(p_i))

这个公式告诉我们：当所有结果出现的概率都相等时（比如一个绝对公平的骰子，每个面概率都是1/6），系统最“混乱”，不确定性最大，此时信息熵达到最大值。相反，如果某个结果出现的概率是100%（其他都是0%），那结果就完全确定了，系统最“有序”，信息熵就是0。

熵权法的巧妙之处，就在于它把每个评价指标（属性）下所有样本的取值，看作一个随机事件的分布。 如果某个指标下，所有样本的取值都差不多（比如所有电脑的价格都在5000元左右），那这个指标的“不确定性”就低，信息熵小，说明它提供的信息量少，在决策时权重就应该小。反之，如果某个指标下，样本取值千差万别（比如电脑价格从3000元到20000元都有），那它的“不确定性”就高，信息熵大，包含的信息量就丰富，在区分不同样本时作用就大，权重自然应该更高。