1、数学期望
数学期望就是总体的均值,或者各项的加权平均。
先看离散的情况,假设X为离散型随机变量,x1,x2,x3,……,xk为随机变量的所有可能取值,p1,p2,p3,……,pk为随机变量相应取值发生的概率,其中p1+p2+p3+……+pk=1。
那么随机变量X的数学期望为:![]()
再看连续的情况,假设X为连续型随机变量,x表示随机变量在实数范围内的联系取值,f(x)为概率密度函数。
那么随机变量X的数学期望为:![]()
2、信息量
一个事件的信息量与这个事件发生的概率是呈负相关的。举个例子:下雨的时候,天上没有太阳,这基本上是一个必然事件,带给我们的信息很少。再举个例子:国足踢进了世界杯,这是个小概率事件,这里面一定有很多曲折的事情,把它搞清楚所需的信息量就越大。
这个很好理解,就拿生活中的例子来说,越大概率事件所涵盖的信息量越小,如:晴天的早上太阳从东边升起,这可以说是一个必然事件,给我们带来的信息几乎为零。如:国足踢进了世界杯,对于这种几乎不可能的小概率事件,人们估计都会想把它搞清楚,想把他们搞清楚需要的信息很多,比如谁踢进的球,他们赛场上表现如何,犯规了吗等等…变量的不确定性越大,把它搞清楚所需要的信息量也就越大,这很容易理解。
下面对信息量下个定义,假设X为随机变量,X取xi的概率为p(xi),那么xi发生的信息量为

本文介绍了信息理论中的基本概念,包括数学期望的离散和连续情况,信息量与事件概率的关系,以及信息熵作为信息量期望的定义。接着,解释了相对熵(KL散度)作为衡量概率分布差异的指标,以及交叉熵在信息论中的作用。这些概念是理解数据处理、编码和通信系统的基础。

480

被折叠的 条评论
为什么被折叠?



