今天看为了准备排队论考试复习了下概率论,看到样本的方差公式除数是n-1,对此很不解。因此查了一些资料并请教了一个学数学出身的朋友。
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示样本均值=(X1+X2+...+Xn)/n
以下是我的理解(感性的认识):
要求总体分布的方差,而我们使用的是样本。计算的是样本值和样本均值的距离。但是如果客观来说,我们应该计算样本值和u的距离。也就是说,我们用样本值代表u是有一定误差的。为了减小这个误差,我们使用了n-1.
百度知道的回答:
首先,用真正的(Xi-μ)^2来看,方差本应该是与μ的差,而不是样本均值的差,增加一个数,就多一个(Xi-μ)^2,n个数据,这n个数据与μ是无关的,就该是n个这相加后除n。也就是自由度是n
但是,用样本均值来减,从这来看X1+X2+...+Xn=nX,这个地方也就是说n个数据与X相关,这就少了一个自由度,从而,用(Xi-X)^2计算时,会相当少了一个原本(Xi-μ)^2。故除n-1。其实这讲得也不太准确,我也不知道怎么说好。
主要还是X1+X2+...+Xn=nX,这个计算出的X,Xi-X这所有相加为0,也就是少了个了,少了什么,我也不知怎么说,自己想吧
验证n-1的正确性
总体方差为σ2
均值为μ
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示样本均值=(X1+X2+...+Xn)/n
设A=(X1-X)^2+(X2-X)^2....+(Xn-X)^2
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=E[(X1)^2-2X*X1+X^2+(X2)^2-2X*X2+X^2+(X2-X)^2....+(Xn)^2-2X*Xn+X^2]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(X1+X2+...+Xn)]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(nX)]
=E[(X1)^2+(X2)^2...+(Xn)^2-nX^2]
而
E(Xi)^2=D(Xi)+[E(Xi)]^2
=σ2+μ2 E(X)^2
=D(X)+[E(X)]^2
=σ2/n+μ2
所以
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=n(σ2+μ2)-n(σ2/n+μ2)
=(n-1)σ2
所以为了保证样本方差的无偏性
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
E(S)=(n-1)σ2/(n-1)=σ2
本文探讨了数理统计中样本方差公式使用n-1作为除数的原因。通过解释样本值与样本均值之间的关系,以及考虑样本值与总体均值μ的误差,阐述了为什么除以n-1可以减小误差并保证样本方差的无偏性。文中还引用了数学原理和期望值计算进行验证。

3582

被折叠的 条评论
为什么被折叠?



