一、熵(PRML)
考虑将A地观测的一个随机变量x,编码后传输到B地。
这个随机变量有8种可能的状态,每个状态都是等可能的。为了把x的值传给接收者,需要传输⼀个3⽐特的消息。注意,这个变量的熵由下式给出:
⾮均匀分布⽐均匀分布的熵要⼩。
如果概率分布非均匀,同样使用等长编码,那么并不是最优的。相反,可以根据随机变量服从的概率分布构建Huffman树,得到最优的前缀编码。
可以利⽤⾮均匀分布这个特点,使⽤更短的编码来描述更可能的事件,使⽤更长的编码来描述不太可能的事件。
可以使⽤下⾯的编码串:0、10、110、1110、111100、111101、111110、111111来表⽰状态{a, b, c, d, e, f, g, h}。传输的编码的平均长度就是

文章介绍了熵在信息传输中的作用,特别是在编码优化中的应用,如使用Huffman编码实现最优传输效率。信息量与事件发生的概率相关,概率越小,信息量越大。熵作为衡量不确定性的度量,表示随机变量的平均编码长度,而交叉熵和KL散度则用于衡量不同概率分布之间的差异和编码代价。

3401

被折叠的 条评论
为什么被折叠?



