13.第五章参数假设检验(2)

最新推荐文章于 2025-06-17 12:00:02 发布

原创最新推荐文章于 2025-06-17 12:00:02 发布 · 1k 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#概率论

《数理统计》学习笔记专栏收录该内容

21 篇文章

订阅专栏

本文深入探讨了参数假设检验的核心概念，包括单正态总体均值和方差的假设检验、双正态总体均值差及方差比的假设检验，以及极限分布为正态分布的参数检验。详细介绍了UUU检验、TTT检验、χ2χ2检验和F检验的原理与应用。

第五章参数假设检验(2)

1.单正态总体均值假设检验

先讨论单正态总体 $N(μ,σ2)N(\mu,\sigma^2)$ 的均值检验。分为单边检验 $H0:μ=μ0↔H1:μ≠μ0H_0:\mu=\mu_0\leftrightarrow H_1:\mu\ne \mu_0$ 与双边检验，这里 $μ0\mu_0$ 和检验水平 $α\alpha$ 是给定的数， $,Xn)\boldsymbol X=(X_1,\cdots,X_n)$ 是从正态总体中抽取的简单随机样本。

对于方差 $σ2\sigma^2$ 已知的情况，以 $Xˉ=1n∑i=1nXi\bar X=\frac1n\sum_{i=1}^nX_i$ 为检验统计量：

$H0:μ=μ0↔H1:μ≠μ0H_0:\mu=\mu_0\leftrightarrow H_1:\mu\ne\mu_0$ 。

如果 $H_0$ 成立，那么 $∣Xˉ−μ0∣|\bar X-\mu_0|$ 不应该过大，所以拒绝域的形式应为 $D={∣Xˉ−μ0∣>A}D=\{|\bar X-\mu_0|>A\}$ ，将其标准化，得到 $D={n∣Xˉ−μ0∣σ>c}D=\{\frac{\sqrt{n}|\bar X-\mu_0|}{\sigma}>c\}$ 。要确定这个 $c$ ，求其去真概率
$\mathbf P_\mu\{\sqrt{n}|\bar x-\mu_0|/\sigma>c|\mu=\mu_0\}=\alpha$
得到 $c=α/2c=\alpha/2$ ，所以拒绝域的形式为
$D=\{|\bar X-\mu_0|>\frac{\sigma u_{\alpha/2}}{\sqrt n}\}$
$H0:μ≤μ0↔H1:μ>μ0H_0:\mu\le\mu_0\leftrightarrow H_1:\mu>\mu_0$ 。

如果 $H_0$ 成立，那么 $(Xˉ−μ0)(\bar X-\mu_0)$ 不应该过大，所以拒绝域的形式应为 $D={Xˉ−μ0>A}D=\{\bar X-\mu_0>A\}$ ，即 $D={n(Xˉ−μ0)σ>c}D=\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}>c\}$ ，去真概率为
$\mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}>c|\mu\le\mu_0\}=\alpha$
这里 $μ\mu$ 不是一个定值，所以要在所有去真概率中取最大的，事实上等价于 $μ\mu$ 最大。于是
$\mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}>c|\mu=\mu_0\}=\alpha\\ c=u_\alpha$
所以拒绝域为 $D={Xˉ−μ0>σuαn}D=\{\bar X-\mu_0>\frac{\sigma u_\alpha}{\sqrt n}\}$ 。
$H0:μ≥μ0↔H1:μ<μ0H_0:\mu\ge\mu_0\leftrightarrow H_1:\mu<\mu_0$ 。

如果 $H_0$ 成立，则 $Xˉ−μ0\bar X-\mu_0$ 不应该过小，因此拒绝域为 $D={n(Xˉ−μ0)σ<c}D=\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}<c\}$ ，（最大的）去真概率为
$\sup_{\mu\ge\mu_0}\mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}<c|\mu\ge\mu_0\}=\alpha\\ \mathbf P_\mu\{\frac{\sqrt n(\bar X-\mu_0)}{\sigma}<c|\mu=\mu_0\}=\alpha\\ c=u_{1-\alpha}=-u_\alpha$
所以拒绝域为 $D={Xˉ−μ0<−σuαn}D=\{\bar X-\mu_0<-\frac{\sigma u_{\alpha}}{\sqrt n}\}$ 。

由于以上三种检验最后都落在标准正态检验统计量 $U$ ，因此已知方差的均值检验也被称为 $U$ 检验。

对于方差 $σ2\sigma^2$ 未知的均值检验，也有以上三种问题。但是此时构造不出标准正态变量 $n(Xˉ−μ0)σ\frac{\sqrt n(\bar X-\mu_0)}{\sigma}$ 。由于之前证明过 $n(Xˉ−μ)S∼tn−1,S2=1n−1∑i=1n(Xˉ−Xi)2\frac{\sqrt n(\bar X-\mu)}{S}\sim t_{n-1},S^2=\frac1{n-1}\sum_{i=1}^n(\bar X-X_i)^2$ ，所以用
$T=\frac{\sqrt n(\bar X-\mu_0)}{S}$
作检验统计量，将以上三种情况中的 $u$ 分位数换成 $t_{n-1}$ 分位数即可。由于这三种检验使用检验统计量 $T$ ，因此未知方差的均值检验被称为 $T$ 检验。

2.单正态总体方差假设检验

正态检验也有单边与双边，分为均值已知和未知的情况。正态总体为 $N(μ,σ2)N(\mu,\sigma^2)$ ，在其中抽取简单随机样本 $,Xn)\boldsymbol X=(X_1,\cdots,X_n)$ ，这里 $σ02\sigma_0^2$ 和 $α\alpha$ 是给定的数。

首先对于均值 $μ\mu$ 未知的情形，此时 $S2=1n−1∑i=n(Xi−Xˉ)2S^2=\frac1{n-1}\sum_{i=}^n(X_i-\bar X)^2$ 是 $σ2\sigma^2$ 的无偏估计，且 $(n−1)S2σ2∼χn−12\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}$ ：

$H0:σ2=σ02↔H1:σ2≠σ02H_0:\sigma^2=\sigma_0^2\leftrightarrow H_1:\sigma^2\ne\sigma_0^2$ 。

如果 $H_0$ 成立，那么 $(n−1)S2σ2\frac{(n-1)S^2}{\sigma^2}$ 既不应该过大也不应该过小，因此拒绝域的形式应为 $D={(n−1)S2σ2<c或(n−1)S2σ2>d}D=\{\frac{(n-1)S^2}{\sigma^2}<c或\frac{(n-1)S^2}{\sigma^2}>d\}$ 。去真概率为
$\mathbf P_\sigma\{\frac{(n-1)S^2}{\sigma^2}<c或\frac{(n-1)S^2}{\sigma^2}>d|\sigma^2=\sigma_0^2\}=\alpha$
取其等尾区间，得到 $c=χn−12(1−α/2),d=χ2n−1(α/2)c=\chi^2_{n-1}(1-\alpha/2),d=\chi^2{n-1}(\alpha/2)$ ，所以拒绝域为 $D={(n−1)S2σ02<χn−12(1−α/2)或(n−1)S2σ02>χn−12(α/2)}D=\{\frac{(n-1)S^2}{\sigma_0^2}<\chi^2_{n-1}(1-\alpha/2)或\frac{(n-1)S^2}{\sigma_0^2}>\chi^2_{n-1}(\alpha/2)\}$ 。
$H0:σ2≤σ02↔H1:σ2>σ02H_0:\sigma^2\le\sigma_0^2\leftrightarrow H_1:\sigma^2>\sigma^2_0$ 。

运用同上的方法，可以得到拒绝域为 $D={(n−1)S2σ2>χn−12(α}D=\{\frac{(n-1)S^2}{\sigma^2}>\chi^2_{n-1}(\alpha\}$ 。
$H0:σ2≥σ02↔H1:σ2<σ02H_0:\sigma^2\ge\sigma_0^2\leftrightarrow H_1:\sigma^2<\sigma_0^2$ 。

运用同上的方法，可以得到拒绝域为 $D={(n−1)S2σ2<χn−12(1−α/2)}D=\{\frac{(n-1)S^2}{\sigma^2}<\chi^2_{n-1}(1-\alpha/2)\}$

对于均值 $μ\mu$ 已知的情形，有 $σ2\sigma^2$ 的无偏估计 $Sn2=1n∑i=1n(Xi−μ)2S_n^2=\frac1n\sum_{i=1}^n(X_i-\mu)^2$ ，且 $nSn2σ2∼χn2\frac{nS_n^2}{\sigma^2}\sim \chi^2_n$ ，所以运用类似的方法，把检验统计量改为 $nSn2σ2\frac{nS_n^2}{\sigma^2}$ ，分位数换成 $χn2\chi^2_n$ 的，就可以得到类似的拒绝域。这种方差的检验被称为 $χ2\chi^2$ 检验。

3.双正态总体均值差假设检验

以下假设 $,Xm)\boldsymbol X=(X_1,\cdots,X_m)$ 是取自总体 $N(μ1,σ12)N(\mu_1,\sigma_1^2)$ 的简单随机样本， $,Yn)\boldsymbol Y=(Y_1,\cdots,Y_n)$ 的是取自总体 $N(μ2,σ22)N(\mu_2,\sigma_2^2)$ 的简单随机样本，且 $X,Y\boldsymbol X,\boldsymbol Y$ 相互独立。双正态总体均值差的假设检验主要围绕着几种特殊情况进行讨论，并且只讨论双边问题 $H0:μ2−μ1=μ0↔H1:μ2−μ1≠μ0H_0:\mu_2-\mu_1=\mu_0\leftrightarrow H_1:\mu_2-\mu_1\neq \mu_0$ 。

当方差 $σ12,σ22\sigma_1^2,\sigma_2^2$ 均已知时的均值差检验。

此时有 $Yˉ−Xˉ∼N(μ2−μ1,σ12/m+σ22/n)\bar Y-\bar X\sim N(\mu_2-\mu_1,\sigma_1^2/m+\sigma_2^2/n)$ ，因此可以取检验统计量为
$U=\frac{\bar Y-\bar X-\mu_0}{\sqrt {\sigma_1^2/m+\sigma_2^2/n}}\sim N(0,1)$
这样就与单正态总体均值检验类似了，此时运用的也是 $U$ 检验。
当方差未知但相等，即 $σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2$ 时的均值差检验。

此时令 $Sw2=1m+n−2[(m−1)S12+(n−1)S22]S_w^2=\frac{1}{m+n-2}[(m-1)S_1^2+(n-1)S_2^2]$ ，则有
$T=\frac{\bar Y-\bar X-\mu_0}{S_w}\sqrt {\frac{mn}{m+n}}\sim t_{m+n-2}$
这样就可以用 $t$ 分布来检验均值差了，这叫两样本 $t$ 检验。
当样本容量相等即 $m = n$ 时的均值差检验。

在实际应用中，需要保证成对数据来自两个独立的正态总体是不容易的，但是如果能保证独立，就可以令 $Z_i=Y_i-X_i$ ， $Z∼N(μ2−μ1,σ12+σ22)Z\sim N(\mu_2-\mu_1,\sigma_1^2+\sigma_2^2)$ ，这样就与单正态总体均值检验类似了，此时运用的是 $t$ 检验。

4.双正态总体方差比假设检验

以下假设 $,Xm)\boldsymbol X=(X_1,\cdots,X_m)$ 是取自总体 $N(μ1,σ12)N(\mu_1,\sigma_1^2)$ 的简单随机样本， $,Yn)\boldsymbol Y=(Y_1,\cdots,Y_n)$ 的是取自总体 $N(μ2,σ22)N(\mu_2,\sigma_2^2)$ 的简单随机样本，且 $X,Y\boldsymbol X,\boldsymbol Y$ 相互独立。下面讨论方差比 $σ22/σ12\sigma_2^2/\sigma_1^2$ 与 $c$ 的双边检验问题。这里记 $Xˉ,Yˉ\bar X,\bar Y$ 为两个样本的均值， $S_1^2,S_2^2$ 为两个样本方差的无偏估计。

当 $μ1,μ2\mu_1,\mu_2$ 未知时的方差比假设检验

在 $σ22/σ12=c\sigma_2^2/\sigma_1^2=c$ 的前提下，有
$F=\frac{S_1^2}{S_2^2}\frac{1}{c}\sim F_{m-1,n-1}$
取等尾区间，得到检验域为 $D={F<Fm−1,n−1(1−α/2)或F>Fm−1,n−1(α/2)}D=\{F<F_{m-1,n-1}(1-\alpha/2)或F>F_{m-1,n-1}(\alpha/2)\}$ 。
当 $μ1,μ2\mu_1,\mu_2$ 已知时，取 $S1∗2=1m∑i=1m(Xi−μ12),S2∗2=1n∑j=1n(Yi−μ2)2S_{1*}^2=\frac1m\sum_{i=1}^m (X_i-\mu_1^2),S_{2*}^2=\frac1n\sum_{j=1}^n (Y_i-\mu_2)^2$ ，可以类似地得到
$F=\frac{S_{1*}^2}{S_{2*}^2}\frac1c\sim F_{m,n}$
因此检验域只需将上面的 $F$ 改为此时的计算方式，并把 $F_{m-1,n-1}$ 分位数改成 $F_{m,n}$ 的即可。这种检验双样本方差比的方式

5.极限分布为正态分布的参数检验

这类问题是大样本问题，一般方差均未知且不等。取检验统计量为
$U^*=\frac{\bar Y-\bar X-\mu_0}{\sqrt {S_1^2/m+S_2^2/n}}\stackrel{\mathscr L}{\longrightarrow }N(0,1)$
如果样本数量不大，则换成
$T_*=\frac{\bar Y-\bar X-\mu_0}{\sqrt {S_1^2/m+S_2^2/n}}\sim t_r\\ r=\frac{S_*^4}{\left[\frac{S_1^4}{m^2(m-1)}+\frac{S_2^4}{n^2(n-1)}\right]},S_*^2=\frac{S_1^2}{m}+\frac{S_2^2}{n}.$