对数几率回归(逻辑回归)
广义线性模型:
- 指数族分布
指数族(Exponential family)分布是一类分布的总称,该类分布的分布律(或者概率密度函数)的一般形式如下:
p(y;η)=b(y)exp(ηTT(y)−a(η)) p(y ; \eta)=b(y) \exp \left(\eta^{T} T(y)-a(\eta)\right) p(y;η)=b(y)exp(ηTT(y)−a(η))
其中η\etaη称为该分布的自然参数;T(y)T(y)T(y)为充分统计量,视具体的分布而定,通常是等于随机变量y本身;a(η)a(\eta)a(η)为配分函数;b(y)b(y)b(y)为关于随机变量y的函数。常见的伯努利分布和正态分布均属于指数族分布。
以下证明伯努利属于指数族分布:
p(y)=ϕy(1−ϕ)1−y p(y)=\phi^{y}(1-\phi)^{1-y} p(y)=ϕy(1−ϕ)1−y
其中y∈{
0,1}y \in {\{0,1\}}y∈{
0,1},p(y=1)=ϕp(y=1) = \phip(y=1)=ϕ对上式恒等变形可得
p(y)=ϕy(1−ϕ)1−y=exp(ln(ϕy(1−ϕ)1−y))=exp(lnϕy+ln(1−ϕ)1−y) \begin{aligned} p(y) &=\phi^{y}(1-\phi)^{1-y} \\ &=\exp \left(\ln \left(\phi^{y}(1-\phi)^{1-y}\right)\right) \\ &=\exp \left(\ln \phi^{y}+\ln (1-\phi)^{1-y}\right) \end{aligned} p(y)=ϕy(1−ϕ)1−y=exp(ln(ϕy(1−ϕ)1−y))=exp(lnϕy+ln(1−ϕ)1−y)
p(y)=exp(ylnϕ+(1−y)ln(1−ϕ))=exp(ylnϕ+ln(1−ϕ)−yln(1−ϕ))=exp(y(lnϕ−ln(1−ϕ))+ln(1−ϕ))=exp(yln(ϕ1−ϕ)+ln(1−ϕ)) \begin{aligned} p(y) &=\exp (y \ln \phi+(1-y) \ln (1-\phi)) \\ &=\exp (y \ln \phi+\ln (1-\phi)-y \ln (1-\phi)) \\ &=\exp (y(\ln \phi-\ln (1-\phi))+\ln (1-\phi)) \\ &=\exp \left(y \ln \left(\frac{\phi}{1-\phi}\right)+\ln (1-\phi)\right) \end{aligned} p(y)=exp(ylnϕ+(1−y)ln(1−ϕ))=exp(ylnϕ+ln(1−ϕ)−yln(1−ϕ))=exp(y(lnϕ−ln(1−ϕ))+ln(1−ϕ))=exp(yln(1−ϕϕ)+ln(1−ϕ))
对比指数族分布可知
b(y)=1η=ln(ϕ1−ϕ)T(y)=ya(η)=−ln(1−ϕ)=ln(1+eη) \begin{aligned} b(y) &=1 \\ \eta &=\ln \left(\frac{\phi}{1-\phi}\right) \\ T(y) &=y \\ a(\eta) &=-\ln (1-\phi)=\ln \left(1+e^{\eta}\right) \end{aligned} b(y)ηT(y)a(η)=1=ln(1−ϕϕ)=y=−ln(1−ϕ)=ln(1+eη)
- 广义线性模型的三条假设
- 在给定

本文介绍了对数几率回归(逻辑回归),它是广义线性模型的一种,适用于二分类问题。通过对伯努利分布的分析,展示了逻辑回归如何满足指数族分布的特性。通过建立线性模型,预测样本属于正例的概率,从而实现分类任务。文章还讨论了极大似然估计在求解模型参数中的应用,并指出逻辑回归虽名为回归,实为分类方法。
&spm=1001.2101.3001.5002&articleId=97680103&d=1&t=3&u=515ac2f8af6a4c4a87d7c034e11bb13f)
6424

被折叠的 条评论
为什么被折叠?



