12.第五章参数假设检验(1)

最新推荐文章于 2025-01-28 16:30:00 发布

原创最新推荐文章于 2025-01-28 16:30:00 发布 · 1.6k 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#概率论

《数理统计》学习笔记专栏收录该内容

21 篇文章

订阅专栏

本文深入探讨了假设检验的基本概念，包括参数型与非参数型检验的区别，原假设与备择假设的设定，以及两类错误的定义。文章还介绍了如何通过样本数据检验总体分布的特征，解释了检验函数的作用，并讨论了Neyman-Pearson准则下的最优检验选择。

第五章参数假设检验(1)

1.假设检验

假设检验问题指通过从总体中抽取一定容量的样本，利用样本来检验总体分布是否具有某种特征。可分为参数型假设检验与非参数型假设检验两种类型，分别适用于总体分布的形式已知和未知的情况。

假设：对于一般的问题，总可以提出一种假设，它是人们认为的关于参数的信息，如正态分布中 $μ≤μ0\mu\le\mu_0$ 就是一种假设，原假设（也叫零假设） $H_0$ 的对立面是备择假设 $H_1$ 。参数检验的问题可以形象地写成
$H_0:\theta\in \Theta_0\longleftrightarrow H_1:\theta\in \Theta_1$
这里 $H_0$ 是假设检验的对象， $H_0$ 和 $H_1$ 的位置不可调换，它们的地位也不同。一般将等号放在 $H_0$ 中。

假设又可以分为简单假设和复合假设，其中简单假设是指，如果 $Θ0\Theta_0$ 中只包含 $Θ\Theta$ 中的一个点，则称 $H_0$ 为简单假设。如 $H_0:a=a_0$ 就是一个简单假设。

要对假设进行检验，可以先求待估参数的一个估计量，如果估计量算出的值与我们的假设情况相差不大，则倾向于接受假设；如果算出的值与我们的假设情况相差很大，则倾向于拒绝假设。

拒绝域 $D$ 指的是，如果样本 $X∈D\boldsymbol X\in D$ 则拒绝 $H_0$ 。一旦规划出了拒绝域，就可以把样本空间 $X\mathscr X$ 分成两部分，一部分位于拒绝域，另一部分则称为落入接受域。拒绝域 $D$ 的制定由具体情况决定。

为了便于数学上的处理，又引入检验函数 $φ(x)\varphi(\boldsymbol x)$ 的概念，它与检验是一一对应的，如果 $φ(x)=1\varphi(\boldsymbol x)=1$ 则说明 $X\boldsymbol X$ 的观测值 $x\boldsymbol x$ 落入拒绝域内，需要拒绝原假设 $H_0$ ，即
$\varphi(\boldsymbol x)=\left\{ \begin{array}{l} 1,&\boldsymbol x\in D;\\ 0,&\boldsymbol x\notin D. \end{array} \right.$
对于只取 $0, 1$ 两个值的检验函数，称为非随机化检验，一般我们提到的检验数都是非随机化检验。

如果对于某些样本有 $0<φ(x)<10<\varphi(\boldsymbol x)<1$ ，则称 $φ(x)\varphi(\boldsymbol x)$ 为随机化检验。随机化检验的检验函数可能是
$\varphi(\boldsymbol x)=\left\{ \begin{array}{l} 0, &T(\boldsymbol x)>c,\\ r, &T(\boldsymbol x)=c,\\ 1, &T(\boldsymbol x)<c. \end{array} \right.$
如果此时出现了 $T(x)=cT(\boldsymbol x)=c$ 的情况，可以作一次成功概率为 $r$ 的实验，根据实验结果来决定是否接受检验。

求解假设检验问题的步骤，是提出假设（ $H_0$ 和 $H_1$ ）、导出否定域 $D$ 确定检验统计、求出检验统计量的临界值、得出结论。

2.两类错误

在假设检验问题中，可能会遇到如下两类错误：

第一类错误：假设 $H_0$ 本来是对的，但样本却落入拒绝域 $D$ 使得我们认为假设 $H_0$ 是错的从而拒绝了 $H_0$ 。这类错误称为去真错误。
第二类错误：假设 $H_0$ 本来是错的，但样本却落入接受域 $Dˉ\bar D$ 使我们认为假设 $H_0$ 是对的从而接受了 $H_0$ 。这类错误称为取伪错误。

在每一个具体的场合，两类错误只会犯一个，并且确定检验方式（拒绝域）后犯两类错误的概率也就确定了。希望犯错误的概率尽可能小，但是一般来说，在样本大小 $n$ 固定的概率下，两类错误的犯错概率是负相关的。

功效函数：设 $φ(x)\varphi(\boldsymbol x)$ 是 $H0:θ∈Θ0⟷H1:θ∈Θ1H_0:\theta\in\Theta_0\longleftrightarrow H_1:\theta\in\Theta_1$ 的检验函数，则称
$\beta_\varphi(\theta)=\mathbf P_\theta\{\text{用检验$\varphi$否定了$H_0$}\}=E_\theta[\varphi(\boldsymbol X)],\theta\in\Theta$
为 $φ\varphi$ 的功效函数，也称效函数或势函数。基于效用函数表示两类错误的犯错概率，可以表示为
$\alpha_\varphi^*(\theta)=\left\{ \begin{array}{l} \beta_\varphi(\theta),&\theta\in\Theta_0,\\ 0,&\theta \in\Theta_1, \end{array} \right. \quad \beta_\varphi^*(\theta)=\left\{ \begin{array}{l} 0,&\theta\in\Theta_0,\\ 1-\beta_\varphi(\theta),&\theta\in\Theta_1. \end{array} \right.$
Neyman-Pearson准则：在保证犯第一类错误的概率不超过指定数值 $α∈(0,1)\alpha\in(0,1)$ 的检验中，寻找犯第二类错误概率尽可能小的检验。

检验的显著性水平：设 $φ\varphi$ 是一个检验而 $0<α<10<\alpha<1$ ，如果 $φ\varphi$ 犯第一类错误的概率总是不超过 $α\alpha$ ，则称 $α\alpha$ 是检验 $φ\varphi$ 的一个水平，称 $φ\varphi$ 是显著性水平为 $α\alpha$ 的检验。这里显著性水平是不唯一的，所以取所有水平中最小的那个为真实水平，即 $sup⁡{βφ(θ),θ∈Θ0}\sup\{\beta_\varphi(\theta),\theta\in\Theta_0\}$ 。