第五章 参数假设检验(2)
1.单正态总体均值假设检验
先讨论单正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的均值检验。分为单边检验H0:μ=μ0↔H1:μ≠μ0H_0:\mu=\mu_0\leftrightarrow H_1:\mu\ne \mu_0H0:μ=μ0↔H1:μ=μ0与双边检验,这里μ0\mu_0μ0和检验水平α\alphaα是给定的数,X=(X1,⋯ ,Xn)\boldsymbol X=(X_1,\cdots,X_n)X=(X1,⋯,Xn)是从正态总体中抽取的简单随机样本。
对于方差σ2\sigma^2σ2已知的情况,以Xˉ=1n∑i=1nXi\bar X=\frac1n\sum_{i=1}^nX_iXˉ=n1∑i=1nXi为检验统计量:
-
H0:μ=μ0↔H1:μ≠μ0H_0:\mu=\mu_0\leftrightarrow H_1:\mu\ne\mu_0H0:μ=μ0↔H1:μ=μ0。
如果H0H_0H0成立,那么∣Xˉ−μ0∣|\bar X-\mu_0|∣Xˉ−μ0∣不应该过大,所以拒绝域的形式应为D={∣Xˉ−μ0∣>A}D=\{|\bar X-\mu_0|>A\}D={∣Xˉ−μ0∣>A},将其标准化,得到D={n∣Xˉ−μ0∣σ>c}D=\{\frac{\sqrt{n}|\bar X-\mu_0|}{\sigma}>c\}D={σn∣Xˉ−μ0∣>c}。要确定这个ccc,求其去真概率
Pμ{n∣xˉ−μ0∣/σ>c∣μ=μ0}=α \mathbf P_\mu\{\sqrt{n}|\bar x-\mu_0|/\sigma>c|\mu=\mu_0\}=\alpha Pμ{n∣xˉ−μ0∣/σ>c∣μ=μ0}=α
得到c=α/2c=\alpha/2c=α/2,所以拒绝域的形式为
D={∣Xˉ−μ0∣>σuα/2n} D=\{|\bar X-\mu_0|>\frac{\sigma u_{\alpha/2}}{\sqrt n}\} D={∣Xˉ−μ0∣>nσuα/2} -
H0:μ≤μ0↔H1:μ>μ0H_0:\mu\le\mu_0\leftrightarrow H_1:\mu>\mu_0H0:μ≤μ0↔H1:μ>μ0。
如果H0H_0H0成立,那么(Xˉ−μ0)(\bar X-\mu_0)(Xˉ−μ0)不应该过大,所以拒绝域的形式应为D={Xˉ−μ0>A}D=\{\bar X-\mu_0>A\}D={Xˉ−μ0>A},即D={n(Xˉ−μ0)σ>c}D=\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}>c\}D={σn(Xˉ−μ0)>c},去真概率为
Pμ{n(Xˉ−μ0)σ>c∣μ≤μ0}=α \mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}>c|\mu\le\mu_0\}=\alpha Pμ{σn(Xˉ−μ0)>c∣μ≤μ0}=α
这里μ\muμ不是一个定值,所以要在所有去真概率中取最大的,事实上等价于μ\muμ最大。于是
Pμ{n(Xˉ−μ0)σ>c∣μ=μ0}=αc=uα \mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}>c|\mu=\mu_0\}=\alpha\\ c=u_\alpha Pμ{σn(Xˉ−μ0)>c∣μ=μ0}=αc=uα
所以拒绝域为D={Xˉ−μ0>σuαn}D=\{\bar X-\mu_0>\frac{\sigma u_\alpha}{\sqrt n}\}D={Xˉ−μ0>nσuα}。 -
H0:μ≥μ0↔H1:μ<μ0H_0:\mu\ge\mu_0\leftrightarrow H_1:\mu<\mu_0H0:μ≥μ0↔H1:μ<μ0。
如果H0H_0H0成立,则Xˉ−μ0\bar X-\mu_0Xˉ−μ0不应该过小,因此拒绝域为D={n(Xˉ−μ0)σ<c}D=\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}<c\}D={σn(Xˉ−μ0)<c},(最大的)去真概率为
supμ≥μ0Pμ{n(Xˉ−μ0)σ<c∣μ≥μ0}=αPμ{n(Xˉ−μ0)σ<c∣μ=μ0}=αc=u1−α=−uα \sup_{\mu\ge\mu_0}\mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}<c|\mu\ge\mu_0\}=\alpha\\ \mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}<c|\mu=\mu_0\}=\alpha\\ c=u_{1-\alpha}=-u_\alpha μ≥μ0supPμ{σn(Xˉ−μ0)<c∣μ≥μ0}=αPμ{σn(Xˉ−μ0)<c∣μ=μ0}=αc=u1−α=−uα
所以拒绝域为D={Xˉ−μ0<−σuαn}D=\{\bar X-\mu_0<-\frac{\sigma u_{\alpha}}{\sqrt n}\}D={Xˉ−μ0<−nσuα}。
由于以上三种检验最后都落在标准正态检验统计量UUU,因此已知方差的均值检验也被称为UUU检验。
对于方差σ2\sigma^2σ2未知的均值检验,也有以上三种问题。但是此时构造不出标准正态变量n(Xˉ−μ0)σ\frac{\sqrt n(\bar X-\mu_0)}{\sigma}σn(Xˉ−μ0)。由于之前证明过n(Xˉ−μ)S∼tn−1,S2=1n−1∑i=1n(Xˉ−Xi)2\frac{\sqrt n(\bar X-\mu)}{S}\sim t_{n-1},S^2=\frac1{n-1}\sum_{i=1}^n(\bar X-X_i)^2Sn(Xˉ−μ)∼tn−1,S2=n−11∑i=1n(Xˉ−Xi)2,所以用
T=n(Xˉ−μ0)S
T=\frac{\sqrt n(\bar X-\mu_0)}{S}
T=Sn(Xˉ−μ0)
作检验统计量,将以上三种情况中的uuu分位数换成tn−1t_{n-1}tn−1分位数即可。由于这三种检验使用检验统计量TTT,因此未知方差的均值检验被称为TTT检验。
2.单正态总体方差假设检验
正态检验也有单边与双边,分为均值已知和未知的情况。正态总体为N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2),在其中抽取简单随机样本X=(X1,⋯ ,Xn)\boldsymbol X=(X_1,\cdots,X_n)X=(X1,⋯,Xn),这里σ02\sigma_0^2σ02和α\alphaα是给定的数。
首先对于均值μ\muμ未知的情形,此时S2=1n−1∑i=n(Xi−Xˉ)2S^2=\frac1{n-1}\sum_{i=}^n(X_i-\bar X)^2S2=n−11∑i=n(Xi−Xˉ)2是σ2\sigma^2σ2的无偏估计,且(n−1)S2σ2∼χn−12\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}σ2(n−1)S2∼χn−12:
-
H0:σ2=σ02↔H1:σ2≠σ02H_0:\sigma^2=\sigma_0^2\leftrightarrow H_1:\sigma^2\ne\sigma_0^2H0:σ2=σ02↔H1:σ2=σ02。
如果H0H_0H0成立,那么(n−1)S2σ2\frac{(n-1)S^2}{\sigma^2}σ2(n−1)S2既不应该过大也不应该过小,因此拒绝域的形式应为D={(n−1)S2σ2<c或(n−1)S2σ2>d}D=\{\frac{(n-1)S^2}{\sigma^2}<c或\frac{(n-1)S^2}{\sigma^2}>d\}D={σ2(n−1)S2<c或σ2(n−1)S2>d}。去真概率为
Pσ{(n−1)S2σ2<c或(n−1)S2σ2>d∣σ2=σ02}=α \mathbf P_\sigma\{\frac{(n-1)S^2}{\sigma^2}<c或\frac{(n-1)S^2}{\sigma^2}>d|\sigma^2=\sigma_0^2\}=\alpha Pσ{σ2(n−1)S2<c或σ2(n−1)S2>d∣σ2=σ02}=α
取其等尾区间,得到c=χn−12(1−α/2),d=χ2n−1(α/2)c=\chi^2_{n-1}(1-\alpha/2),d=\chi^2{n-1}(\alpha/2)c=χn−12(1−α/2),d=χ2n−1(α/2),所以拒绝域为D={(n−1)S2σ02<χn−12(1−α/2)或(n−1)S2σ02>χn−12(α/2)}D=\{\frac{(n-1)S^2}{\sigma_0^2}<\chi^2_{n-1}(1-\alpha/2)或\frac{(n-1)S^2}{\sigma_0^2}>\chi^2_{n-1}(\alpha/2)\}D={σ02(n−1)S2<χn−12(1−α/2)或σ02(n−1)S2>χn−12(α/2)}。 -
H0:σ2≤σ02↔H1:σ2>σ02H_0:\sigma^2\le\sigma_0^2\leftrightarrow H_1:\sigma^2>\sigma^2_0H0:σ2≤σ02↔H1:σ2>σ02。
运用同上的方法,可以得到拒绝域为D={(n−1)S2σ2>χn−12(α}D=\{\frac{(n-1)S^2}{\sigma^2}>\chi^2_{n-1}(\alpha\}D={σ2(n−1)S2>χn−12(α}。
-
H0:σ2≥σ02↔H1:σ2<σ02H_0:\sigma^2\ge\sigma_0^2\leftrightarrow H_1:\sigma^2<\sigma_0^2H0:σ2≥σ02↔H1:σ2<σ02。
运用同上的方法,可以得到拒绝域为D={(n−1)S2σ2<χn−12(1−α/2)}D=\{\frac{(n-1)S^2}{\sigma^2}<\chi^2_{n-1}(1-\alpha/2)\}D={σ2(n−1)S2<χn−12(1−α/2)}
对于均值μ\muμ已知的情形,有σ2\sigma^2σ2的无偏估计Sn2=1n∑i=1n(Xi−μ)2S_n^2=\frac1n\sum_{i=1}^n(X_i-\mu)^2Sn2=n1∑i=1n(Xi−μ)2,且nSn2σ2∼χn2\frac{nS_n^2}{\sigma^2}\sim \chi^2_nσ2nSn2∼χn2,所以运用类似的方法,把检验统计量改为nSn2σ2\frac{nS_n^2}{\sigma^2}σ2nSn2,分位数换成χn2\chi^2_nχn2的,就可以得到类似的拒绝域。这种方差的检验被称为χ2\chi^2χ2检验。
3.双正态总体均值差假设检验
以下假设X=(X1,⋯ ,Xm)\boldsymbol X=(X_1,\cdots,X_m)X=(X1,⋯,Xm)是取自总体N(μ1,σ12)N(\mu_1,\sigma_1^2)N(μ1,σ12)的简单随机样本,Y=(Y1,⋯ ,Yn)\boldsymbol Y=(Y_1,\cdots,Y_n)Y=(Y1,⋯,Yn)的是取自总体N(μ2,σ22)N(\mu_2,\sigma_2^2)N(μ2,σ22)的简单随机样本,且X,Y\boldsymbol X,\boldsymbol YX,Y相互独立。双正态总体均值差的假设检验主要围绕着几种特殊情况进行讨论,并且只讨论双边问题H0:μ2−μ1=μ0↔H1:μ2−μ1≠μ0H_0:\mu_2-\mu_1=\mu_0\leftrightarrow H_1:\mu_2-\mu_1\neq \mu_0H0:μ2−μ1=μ0↔H1:μ2−μ1=μ0。
-
当方差σ12,σ22\sigma_1^2,\sigma_2^2σ12,σ22均已知时的均值差检验。
此时有Yˉ−Xˉ∼N(μ2−μ1,σ12/m+σ22/n)\bar Y-\bar X\sim N(\mu_2-\mu_1,\sigma_1^2/m+\sigma_2^2/n)Yˉ−Xˉ∼N(μ2−μ1,σ12/m+σ22/n),因此可以取检验统计量为
U=Yˉ−Xˉ−μ0σ12/m+σ22/n∼N(0,1) U=\frac{\bar Y-\bar X-\mu_0}{\sqrt {\sigma_1^2/m+\sigma_2^2/n}}\sim N(0,1) U=σ12/m+σ22/nYˉ−Xˉ−μ0∼N(0,1)
这样就与单正态总体均值检验类似了,此时运用的也是UUU检验。 -
当方差未知但相等,即σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2σ12=σ22=σ2时的均值差检验。
此时令Sw2=1m+n−2[(m−1)S12+(n−1)S22]S_w^2=\frac{1}{m+n-2}[(m-1)S_1^2+(n-1)S_2^2]Sw2=m+n−21[(m−1)S12+(n−1)S22],则有
T=Yˉ−Xˉ−μ0Swmnm+n∼tm+n−2 T=\frac{\bar Y-\bar X-\mu_0}{S_w}\sqrt {\frac{mn}{m+n}}\sim t_{m+n-2} T=SwYˉ−Xˉ−μ0m+nmn∼tm+n−2
这样就可以用ttt分布来检验均值差了,这叫两样本ttt检验。 -
当样本容量相等即m=nm=nm=n时的均值差检验。
在实际应用中,需要保证成对数据来自两个独立的正态总体是不容易的,但是如果能保证独立,就可以令Zi=Yi−XiZ_i=Y_i-X_iZi=Yi−Xi,Z∼N(μ2−μ1,σ12+σ22)Z\sim N(\mu_2-\mu_1,\sigma_1^2+\sigma_2^2)Z∼N(μ2−μ1,σ12+σ22),这样就与单正态总体均值检验类似了,此时运用的是ttt检验。
4.双正态总体方差比假设检验
以下假设X=(X1,⋯ ,Xm)\boldsymbol X=(X_1,\cdots,X_m)X=(X1,⋯,Xm)是取自总体N(μ1,σ12)N(\mu_1,\sigma_1^2)N(μ1,σ12)的简单随机样本,Y=(Y1,⋯ ,Yn)\boldsymbol Y=(Y_1,\cdots,Y_n)Y=(Y1,⋯,Yn)的是取自总体N(μ2,σ22)N(\mu_2,\sigma_2^2)N(μ2,σ22)的简单随机样本,且X,Y\boldsymbol X,\boldsymbol YX,Y相互独立。下面讨论方差比σ22/σ12\sigma_2^2/\sigma_1^2σ22/σ12与ccc的双边检验问题。这里记Xˉ,Yˉ\bar X,\bar YXˉ,Yˉ为两个样本的均值,S12,S22S_1^2,S_2^2S12,S22为两个样本方差的无偏估计。
-
当μ1,μ2\mu_1,\mu_2μ1,μ2未知时的方差比假设检验
在σ22/σ12=c\sigma_2^2/\sigma_1^2=cσ22/σ12=c的前提下,有
F=S12S221c∼Fm−1,n−1 F=\frac{S_1^2}{S_2^2}\frac{1}{c}\sim F_{m-1,n-1} F=S22S12c1∼Fm−1,n−1
取等尾区间,得到检验域为D={F<Fm−1,n−1(1−α/2)或F>Fm−1,n−1(α/2)}D=\{F<F_{m-1,n-1}(1-\alpha/2)或F>F_{m-1,n-1}(\alpha/2)\}D={F<Fm−1,n−1(1−α/2)或F>Fm−1,n−1(α/2)}。 -
当μ1,μ2\mu_1,\mu_2μ1,μ2已知时,取S1∗2=1m∑i=1m(Xi−μ12),S2∗2=1n∑j=1n(Yi−μ2)2S_{1*}^2=\frac1m\sum_{i=1}^m (X_i-\mu_1^2),S_{2*}^2=\frac1n\sum_{j=1}^n (Y_i-\mu_2)^2S1∗2=m1∑i=1m(Xi−μ12),S2∗2=n1∑j=1n(Yi−μ2)2,可以类似地得到
F=S1∗2S2∗21c∼Fm,n F=\frac{S_{1*}^2}{S_{2*}^2}\frac1c\sim F_{m,n} F=S2∗2S1∗2c1∼Fm,n
因此检验域只需将上面的FFF改为此时的计算方式,并把Fm−1,n−1F_{m-1,n-1}Fm−1,n−1分位数改成Fm,nF_{m,n}Fm,n的即可。这种检验双样本方差比的方式
5.极限分布为正态分布的参数检验
这类问题是大样本问题,一般方差均未知且不等。取检验统计量为
U∗=Yˉ−Xˉ−μ0S12/m+S22/n⟶LN(0,1)
U^*=\frac{\bar Y-\bar X-\mu_0}{\sqrt {S_1^2/m+S_2^2/n}}\stackrel{\mathscr L}{\longrightarrow }N(0,1)
U∗=S12/m+S22/nYˉ−Xˉ−μ0⟶LN(0,1)
如果样本数量不大,则换成
T∗=Yˉ−Xˉ−μ0S12/m+S22/n∼trr=S∗4[S14m2(m−1)+S24n2(n−1)],S∗2=S12m+S22n.
T_*=\frac{\bar Y-\bar X-\mu_0}{\sqrt {S_1^2/m+S_2^2/n}}\sim t_r\\
r=\frac{S_*^4}{\left[\frac{S_1^4}{m^2(m-1)}+\frac{S_2^4}{n^2(n-1)}\right]},S_*^2=\frac{S_1^2}{m}+\frac{S_2^2}{n}.
T∗=S12/m+S22/nYˉ−Xˉ−μ0∼trr=[m2(m−1)S14+n2(n−1)S24]S∗4,S∗2=mS12+nS22.
本文深入探讨了参数假设检验的核心概念,包括单正态总体均值和方差的假设检验、双正态总体均值差及方差比的假设检验,以及极限分布为正态分布的参数检验。详细介绍了UUU检验、TTT检验、χ2χ2检验和F检验的原理与应用。

1395

被折叠的 条评论
为什么被折叠?



