数学期望、信息量、信息熵、相对熵、交叉熵

最新推荐文章于 2025-07-19 06:40:47 发布

原创

最新推荐文章于 2025-07-19 06:40:47 发布 · 4.9k 阅读

·

1

·

标签

#信息熵 #机器学习

本文介绍了信息理论中的基本概念，包括数学期望的离散和连续情况，信息量与事件概率的关系，以及信息熵作为信息量期望的定义。接着，解释了相对熵（KL散度）作为衡量概率分布差异的指标，以及交叉熵在信息论中的作用。这些概念是理解数据处理、编码和通信系统的基础。

1、数学期望

数学期望就是总体的均值，或者各项的加权平均。

先看离散的情况，假设X为离散型随机变量，x1，x2，x3，……，xk为随机变量的所有可能取值，p1，p2，p3，……，pk为随机变量相应取值发生的概率，其中p1+p2+p3+……+pk=1。

那么随机变量X的数学期望为：

再看连续的情况，假设X为连续型随机变量，x表示随机变量在实数范围内的联系取值，f(x)为概率密度函数。

那么随机变量X的数学期望为：

2、信息量

一个事件的信息量与这个事件发生的概率是呈负相关的。举个例子：下雨的时候，天上没有太阳，这基本上是一个必然事件，带给我们的信息很少。再举个例子：国足踢进了世界杯，这是个小概率事件，这里面一定有很多曲折的事情，把它搞清楚所需的信息量就越大。

这个很好理解，就拿生活中的例子来说，越大概率事件所涵盖的信息量越小，如：晴天的早上太阳从东边升起，这可以说是一个必然事件，给我们带来的信息几乎为零。如：国足踢进了世界杯，对于这种几乎不可能的小概率事件，人们估计都会想把它搞清楚，想把他们搞清楚需要的信息很多，比如谁踢进的球，他们赛场上表现如何，犯规了吗等等…变量的不确定性越大，把它搞清楚所需要的信息量也就越大，这很容易理解。

下面对信息量下个定义，假设X为随机变量，X取xi的概率为p(xi)，那么xi发生的信息量为

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。