为什么极大似然估计得到的方差是有偏估计

本文探讨了极大似然估计中方差估计的有偏性问题,并通过一维正态分布的例子进行了详细的数学推导,展示了为什么极大似然估计得到的方差是有偏的。

问题来源

在学习模式分类过程中,我们会用到极大似然估计,最常见的是用它来估计期望和方差,而概率论中有这个结论,就是极大似然估计得到的方差是有偏的,那么为什么呢?

估计的无偏性

如果 θ^\hat{\theta}θ^ 是我们对θ\thetaθ 的估计,则满足 E(θ^)=θE(\hat\theta)=\thetaE(θ^)=θ 时我们说该估计是无偏的.

极大似然估计

假设样本集DDD中有nnn个样本:x1,x2,…xnx_1,x_2,\ldots x_nx1,x2,xn.我们需要估计的参数是θ\thetaθ,由于这些样本是独立抽取的,所以有下式成立:
p(D∣θ)=∏k=1np(xk∣θ) p(D|\theta)=\prod_{k=1}^{n}p(x_k|\theta) p(Dθ)=k=1np(xkθ)
为简化计算,使用对数似然函数:
l(θ)=ln⁡(p(D∣θ))=∑k=1nln⁡(p(xk∣θ)l(\theta)=\ln(p(D|\theta))=\sum_{k=1}^n \ln (p(x_k|\theta)l(θ)=ln(p(Dθ))=k=1nln(p(xkθ)
我们要求其极大值,对其求梯度,梯度为零的地方就是可能的极大值处:
∇θ=∑k=1n∇θln⁡(p(xk∣θ)) \nabla_\theta=\sum_{k=1}^{n}\nabla_\theta \ln(p(x_k|\theta)) θ=k=1nθln(p(xkθ))
对于一维的正态分布,有:
ln⁡p(x)=−122πσ−12σ(x−μ)2 \ln p(x)= -\frac{1}{2}2\pi\sigma-\frac{1}{2\sigma}(x-\mu)^2lnp(x)=212πσ

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值