目录
十五、最大熵模型(maximum entropy model,MaxEnt)
十五、最大熵模型(maximum entropy model,MaxEnt)
最大熵模型假设分类模型是一个条件概率分布P(Y|X),X为特征,Y为输出。
定义在条件概率分布P(Y|X)上的条件熵为:
![]()
我们的目标是得到使H(P)最大的时候对应的P(y|x),这里可以对H(P)加了个负号求极小值,这样做的目的是为了使−H(P)为凸函数,方便使用凸优化的方法来求极值。

![]()
最大熵模型的优点有:
a) 最大熵统计模型获得的是所有满足约束条件的模型中信息熵极大的模型,作为经典的分类模型时准确率较高。
b) 可以灵活地设置约束条件,通过约束条件的多少可以调节模型对未知数据的适应度和对已知数据的拟合程度
最大熵模型的缺点有:
- 由于约束函数数量和样本数目有关系,导致迭代过程计算量巨大,实际应用比较难。
参考资料:
李航《统计学习方法》
http://www.cnblogs.com/jiangxinyang/p/9337094.html
https://blog.csdn.net/wjwfighting/article/details/82532847
https://www.cnblogs.com/pinard/category/894692.html
https://www.baidu.com/link?url=HfzWgzeRIWPH08txoXXCO7lJBotxDpxOfRDJE44TUY_-sKMQnXXrXZ7e3-Vs9BBsjKsd7ZXZ9v8_QjWj4fcIzNHVxZ8PnbhWOmUUvjeff0m&wd=&eqid=ffca968a000e7f22000000035bab7277
声明:本人从互联网搜集了一些资料整理,由于查找资料太多,好多内容出处不能记得,如有侵权内容,请各位博主及时联系我,我将尽快修改,并注明出处,再次感谢各位广大博主的资料。

本文深入解析最大熵模型(MaxEnt),探讨其在条件概率分布P(Y|X)下的应用,及其在分类任务中高准确率的优势。同时,文章指出模型可通过灵活设置约束条件以平衡对未知数据的适应度和已知数据的拟合度,但也存在计算量大的缺点。

2255

被折叠的 条评论
为什么被折叠?



