Python实现信息熵算法——附完整代码

最新推荐文章于 2024-09-14 09:04:29 发布

原创最新推荐文章于 2024-09-14 09:04:29 发布 · 4.7k 阅读

标签

#python #算法 #开发语言

收录于

Python专栏同时被 2 个专栏收录

457 篇文章 ¥129.90 ¥299.90

订阅专栏

Python笔记专栏

457 篇文章 ¥119.90 ¥299.90

订阅专栏

本文介绍了信息熵在数据处理中的应用，详细讲解了如何使用Python实现信息熵算法，并提供了完整的源代码示例。通过计算数据集各变量的概率分布，进而求得信息熵，帮助评估数据的复杂程度。

Python实现信息熵算法——附完整代码

信息熵是信息理论中的一个重要概念，用于描述信息的不确定性。在数据处理领域中，信息熵经常用来评估数据的复杂程度和统计特性。本文将介绍如何用Python实现信息熵算法，并提供附有完整源代码。

首先，我们需要了解信息熵的计算公式：

H(X) = - Σ p(x) * log2 p(x)

其中，H(X)代表随机变量X的信息熵，p(x)代表X的概率分布。利用该公式，我们可以将信息熵的计算转换为计算各个变量出现的概率，并据此计算信息熵。

下面是Python实现信息熵算法的代码：

import math

def entropy(data):
    """
    计算信息熵
    :param data: 数据集
    :return: 信息熵
    """
    length = len(data)
    counter = {}
    for item in data:
        counter[item] = counter.get(item, 0) + 1
    ent = 0.0
    for _, cnt in counter.items():
        p = float(cnt) / length
        ent -= p * math.log2(p)
    return ent

在上述代码中，我们定义了一个名为entropy的函数，它接受一个数据集作为参数，并返回该数据集的信息熵。该函数先根据输入数据计算每个变量出现的频率，并根据此计算信息熵。

接下来，我们可以通过样例数据测试一下该函数的效果：

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

NoABug

关注关注

6
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

Python计算信息熵实例

09-16

主要介绍了Python计算信息熵实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

参与评论您还未登录，请先登录后发表或查看评论

python 信息熵

small__roc的博客

03-11

4862

文章目录一、熵的概念与定义二、python 实现一、熵的概念与定义熵概念熵，在信息论中是用来刻画信息混乱程度的一种度量。熵最早源于热力学，后应广泛用于物理、化学、信息论等领域。1850年，德国物理学家鲁道夫·克劳修斯首次提出熵的概念，用来表示任何一种能量在空间中分布的均匀程度。1948年，Shannon在Bell System Technical Journal上发表文章“A Mathematical Theory of Communication”，将信息熵的概念引入信息论中。本文所说的熵就

python 信息熵、条件熵、信息增益、信息增益率、基尼系数

small__roc的博客

03-11

8047

三、python 实现 import math from collections import Counter def Entropy(DataList): ''' 计算随机变量的熵 ''' counts = len(DataList) # 总数量 counter = Counter(DataList) # 每个变量出现的次数 prob = {i[0]:i[1]/counts for i in counter.items()} ..

Python实现熵算法

2301_79366332的博客

09-10

1207

本文介绍了如何使用Python实现熵算法，并提供了相应的源代码。通过计算熵，我们可以评估数据集的纯度或信息量，从而帮助我们进行数据分析和决策。在计算机科学和数据分析领域，熵常被用于评估数据集的纯度或信息量。本文将介绍如何使用Python实现熵算法，并提供相应的源代码。在示例代码中，我们使用了一个简单的数据集来计算熵。其中，P(x)表示随机变量X取值为x的概率，Σ表示对所有可能取值进行求和，log2表示以2为底的对数运算。接下来，我们通过遍历每个类别的概率，计算每个类别的信息量并进行累加。

【Pytorch】几种常见的熵

qq_45405136的博客

06-27

2119

分享几种常见的熵

Python计算信息熵

Mr.horse的博客

11-14

2万+

计算信息熵的公式：n是类别数，p(xi)是第i类的概率假设数据集有m行，即m个样本，每一行最后一列为该样本的标签，计算数据集信息熵的代码如下： from math import log def calcShannonEnt(dataSet): numEntries = len(dataSet) # 样本数 labelCounts = {} # 该数据集每个类别的频数...

在西瓜数据集上用Python实现ID3决策树算法完整代码

myec_lipse的博客

10-11

9660

在西瓜数据集上用Python实现ID3决策树算法完整代码。

数据挖掘领域十大经典算法之—C4.5算法（超详细附代码）

热门推荐

fuqiuai的博客

03-06

7万+

【python代码实现】决策树分类算法

weixin_47974364的博客

04-11

2万+

目录模拟数据决策树分类算法构建数据集绘制决策树代码模拟数据编号年龄收入范围工作性质信用评级购买决策 01 <30 高不稳定较差否 02 <30 高不稳定好否 03 30-40 高不稳定较差是 04 >40 中等不稳定较差是 05 >40 低稳定较差是 06 >40 低稳定好否 07 30-40 低稳定好是 08 <30 中等不稳定较差否 09 <30 低稳

Python编程实现基于信息熵进行划分选择的决策树算法

仰起脸笑得像满月

09-05

1万+

本篇是周志华老师的《机器学习》第4章决策树课后题4.3的实现，原题是：试编程实现基于信息熵进行划分选择的决策树算法，并为表4.3中数据生成一颗决策树。这里需要注意的是此数据集中，有的属性是离散的，有的属性是连续的，对于连续的属性，我们可以使用二分法将样本分为两个部分。这个数据集可以从Dataset.py中粘贴： def watermelon3(): """ ...

python计算信息熵_Python计算信息熵实例

weixin_39657125的博客

12-09

4159

计算信息熵的公式：n是类别数，p(xi)是第i类的概率假设数据集有m行，即m个样本，每一行最后一列为该样本的标签，计算数据集信息熵的代码如下：from math import logdef calcShannonEnt(dataSet):numEntries = len(dataSet) # 样本数labelCounts = {} # 该数据集每个类别的频数for featVec in dataS...

（pytorch进阶之路）交叉熵、信息熵、二分类交叉熵、负对数似然、KL散度、余弦相似度

qq_19841133的博客

09-18

2581

时空维放后面比如C后面依次是H，W，channel，T，把分类维度C放在第二维度，后面的维度多少维都没问题，注意这里的input是未归一化的，也就是没有进行softmax。target可以传入一个整型，一个类别的标签，如果输入是[N,C],则传入[N]，如果输入传入的是[N,C,…] ，则target为[N,…做机器学习的时候，用CE和kld其实是一样的，因为IE传入的target分布是一个one-hot分布，熵其实为0，如果是非delta分布计算出的结果也是一个常数，对参数更新没有任何贡献。

python计算熵

Mr.horse的博客

03-10

6053

熵的计算公式： p(x)为概率，全部概率之和为1 假设 probs是网络输出的n分类预测概率，尺寸为[batch_size,n]，那么预测熵的计算代码如下： log_probs = np.log2(probs) shang = -1 * np.sum(probs * log_probs, axis=1) ...

python 实现entropy熵算法

最新发布

luthane的博客

09-14

1819

Entropy（熵）算法并不是一个单一的、具体的算法，而是一个广泛的概念，用于描述系统无序程度或信息不确定性的量度。在计算机科学、信息论、热力学等多个领域中，熵都有重要的应用。在计算机科学中，特别是在信息论和机器学习中，熵通常用于评估信息的不确定性和冗余性，以及评估模型的复杂性和泛化能力。信息熵是度量信息不确定性的量。HX−∑x∈XPxlog⁡2PxHX−x∈X∑Pxlog2Px)]其中，(P(x)) 是随机变量X取值为x的概率。

熵值法原理及python实现附指标编制案例

侯小啾技术博客

02-02

1万+

熵值法也称熵权法，是学术研究，及实际应用中的一种常用且有效的编制指标的方法。

【Pytorch神经网络理论篇】 21 信息熵与互信息：联合熵+条件熵+交叉熵+相对熵/KL散度/信息散度+JS散度

小李的研究生学习日记

03-23

9383

1 信息熵 熵 (Entropy)，信息熵：常被用来作为一个系统的信息含量的量化指标，从而可以进一步用来作为系统方程优化的目标或者参数选择的判据。 1.1 信息熵的性质单调性，发生概率越高的事件，其携带的信息量越低；非负性，信息熵可以看作为一种广度量，非负性是一种合理的必然；累加性，多随机事件同时发生存在的总不确定性的量度约等于各事件不确定性的量度的和，假设信息熵的函数是I，计算概率的函数是P，I是关于P的减函数，即I(P1,P2)=I(P1)+I(P2)。 1.1.1 信息熵的公式

决策树分类算法（一）（信息熵，信息增益，基尼指数计算）

weixin_46028606的博客

02-12

5998

决策树分类算法（一）（信息熵，信息增益，基尼指数计算）

使用Python计算离散随机变量的熵(Entropy)

飞机火车巴雷特的博客

05-21

1万+

通过SciPy库在Python中计算离散随机变量的熵

Python_熵计算实现

weixin_43210097的博客

08-29

5709

简单几行代码就OK了，还是比较容易的。之前有的博客是直接将每个元素的概率作为输入计算熵的，本文加入了数据概率的计算功能，这样就更加方便一步到位了。