机器学习笔记--对数几率回归(逻辑回归)

本文介绍了对数几率回归(逻辑回归),它是广义线性模型的一种,适用于二分类问题。通过对伯努利分布的分析,展示了逻辑回归如何满足指数族分布的特性。通过建立线性模型,预测样本属于正例的概率,从而实现分类任务。文章还讨论了极大似然估计在求解模型参数中的应用,并指出逻辑回归虽名为回归,实为分类方法。

对数几率回归(逻辑回归)

广义线性模型:

  • 指数族分布

指数族(Exponential family)分布是一类分布的总称,该类分布的分布律(或者概率密度函数)的一般形式如下:
p(y;η)=b(y)exp⁡(ηTT(y)−a(η)) p(y ; \eta)=b(y) \exp \left(\eta^{T} T(y)-a(\eta)\right) p(y;η)=b(y)exp(ηTT(y)a(η))
其中η\etaη称为该分布的自然参数;T(y)T(y)T(y)为充分统计量,视具体的分布而定,通常是等于随机变量y本身;a(η)a(\eta)a(η)为配分函数;b(y)b(y)b(y)为关于随机变量y的函数。常见的伯努利分布和正态分布均属于指数族分布。

以下证明伯努利属于指数族分布:
p(y)=ϕy(1−ϕ)1−y p(y)=\phi^{y}(1-\phi)^{1-y} p(y)=ϕy(1ϕ)1y
其中y∈{ 0,1}y \in {\{0,1\}}y{ 0,1}p(y=1)=ϕp(y=1) = \phip(y=1)=ϕ对上式恒等变形可得
p(y)=ϕy(1−ϕ)1−y=exp⁡(ln⁡(ϕy(1−ϕ)1−y))=exp⁡(ln⁡ϕy+ln⁡(1−ϕ)1−y) \begin{aligned} p(y) &=\phi^{y}(1-\phi)^{1-y} \\ &=\exp \left(\ln \left(\phi^{y}(1-\phi)^{1-y}\right)\right) \\ &=\exp \left(\ln \phi^{y}+\ln (1-\phi)^{1-y}\right) \end{aligned} p(y)=ϕy(1ϕ)1y=exp(ln(ϕy(1ϕ)1y))=exp(lnϕy+ln(1ϕ)1y)

p(y)=exp⁡(yln⁡ϕ+(1−y)ln⁡(1−ϕ))=exp⁡(yln⁡ϕ+ln⁡(1−ϕ)−yln⁡(1−ϕ))=exp⁡(y(ln⁡ϕ−ln⁡(1−ϕ))+ln⁡(1−ϕ))=exp⁡(yln⁡(ϕ1−ϕ)+ln⁡(1−ϕ)) \begin{aligned} p(y) &=\exp (y \ln \phi+(1-y) \ln (1-\phi)) \\ &=\exp (y \ln \phi+\ln (1-\phi)-y \ln (1-\phi)) \\ &=\exp (y(\ln \phi-\ln (1-\phi))+\ln (1-\phi)) \\ &=\exp \left(y \ln \left(\frac{\phi}{1-\phi}\right)+\ln (1-\phi)\right) \end{aligned} p(y)=exp(ylnϕ+(1y)ln(1ϕ))=exp(ylnϕ+ln(1ϕ)yln(1ϕ))=exp(y(lnϕln(1ϕ))+ln(1ϕ))=exp(yln(1ϕϕ)+ln(1ϕ))

对比指数族分布可知
b(y)=1η=ln⁡(ϕ1−ϕ)T(y)=ya(η)=−ln⁡(1−ϕ)=ln⁡(1+eη) \begin{aligned} b(y) &=1 \\ \eta &=\ln \left(\frac{\phi}{1-\phi}\right) \\ T(y) &=y \\ a(\eta) &=-\ln (1-\phi)=\ln \left(1+e^{\eta}\right) \end{aligned} b(y)ηT(y)a(η)=1=ln(1ϕϕ)=y=ln(1ϕ)=ln(1+eη)

  • 广义线性模型的三条假设
    • 在给定
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值