逻辑斯蒂回归,最大熵模型及其等价性

最新推荐文章于 2025-04-26 17:36:09 发布

原创

最新推荐文章于 2025-04-26 17:36:09 发布 · 2.8k 阅读

·

3

·

标签

#逻辑斯蒂回归 #最大熵 #LR回归 #MaxEnt #GLM

本文深入探讨逻辑斯蒂回归模型和最大熵模型，通过推导展示两者在特定条件下的等价性。首先介绍了逻辑斯蒂回归的sigmoid函数及其最大似然估计，接着阐述最大熵模型的熵最大化原则，并在约束条件下构建拉格朗日函数。最终，文章揭示了逻辑斯蒂回归与最大熵模型的联系，为理解这两种分类方法提供了理论依据。

首先推导二类分类训练集上的逻辑斯蒂回归模型(Logistic Regression), 然后推导最大熵模型(Maximum Entropy Model), 最后给出给出最大熵模型等价于逻辑斯蒂回归模型的条件.

1. 逻辑斯蒂回归

训练集 $T=\{(x_i, y_i)|i=1, 2, ..., N\}, x \in R^n, y\in\{0, 1\}$ .

我们假设特征 $X$ 与输出 $Y$ 之间具有某种相关关系: $X,Y$ 是随机变量, 且 $X$ 的取值决定了 $Y$ 的分布, 即 $Y=Y(x)$ .

为了预测 $Y$ 的取值,我们建立模型拟合 $Y$ 在 $X$ 给定时的条件概率:

P (Y = 1 | X = x) = P {Y (x) = 1} = f (x; β)

$P(Y=1|X=x) = P\{Y(x)=1\}=f(x;\beta)$ ,其中

f(x;β) $f(x;\beta)$ 是用来拟合这个条件概率的 参数模型.

我们希望参数模型 $f(x;\beta)$ 满足这样的性质:

$f(x;\beta)\in[0,1]$ .
$f$ 应该至少是个连续函数. 这是因为我们希望模型 $f$ 的输出能够随 $x$ 平滑地变化.
$f$ 应该尽可能简单.

幸运的是, 恰好存在一个函数完美满足上述所有条件,即sigmoid函数:

f (x; β) = 1 1 + e - ( β 0 + β T 1 x )

$f(x;\beta)=\frac{1}{1+e^{-(\beta_0+\beta_1^Tx)}}$

于是,我们的模型变成:

P (Y = 1 | X = x) = 1 1 + e - ( β 0 + β T 1 x )

$P(Y=1|X=x) = \frac{1}{1+e^{-(\beta_0+\beta_1^Tx)}}$

我们使用最大似然估计来求解模型参数 $\beta$ :

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ max β L (β) L (β

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。