12.第五章 参数假设检验(1)

本文深入探讨了假设检验的基本概念,包括参数型与非参数型检验的区别,原假设与备择假设的设定,以及两类错误的定义。文章还介绍了如何通过样本数据检验总体分布的特征,解释了检验函数的作用,并讨论了Neyman-Pearson准则下的最优检验选择。

第五章 参数假设检验(1)

1.假设检验

假设检验问题指通过从总体中抽取一定容量的样本,利用样本来检验总体分布是否具有某种特征。可分为参数型假设检验与非参数型假设检验两种类型,分别适用于总体分布的形式已知和未知的情况。

假设:对于一般的问题,总可以提出一种假设,它是人们认为的关于参数的信息,如正态分布中μ≤μ0\mu\le\mu_0μμ0就是一种假设,原假设(也叫零假设)H0H_0H0的对立面是备择假设H1H_1H1。参数检验的问题可以形象地写成
H0:θ∈Θ0⟷H1:θ∈Θ1 H_0:\theta\in \Theta_0\longleftrightarrow H_1:\theta\in \Theta_1 H0:θΘ0H1:θΘ1
这里H0H_0H0是假设检验的对象,H0H_0H0H1H_1H1的位置不可调换,它们的地位也不同。一般将等号放在H0H_0H0中。

假设又可以分为简单假设和复合假设,其中简单假设是指,如果Θ0\Theta_0Θ0中只包含Θ\ThetaΘ中的一个点,则称H0H_0H0为简单假设。如H0:a=a0H_0:a=a_0H0:a=a0就是一个简单假设。


要对假设进行检验,可以先求待估参数的一个估计量,如果估计量算出的值与我们的假设情况相差不大,则倾向于接受假设;如果算出的值与我们的假设情况相差很大,则倾向于拒绝假设。

拒绝域DDD指的是,如果样本X∈D\boldsymbol X\in DXD则拒绝H0H_0H0。一旦规划出了拒绝域,就可以把样本空间X\mathscr XX分成两部分,一部分位于拒绝域,另一部分则称为落入接受域。拒绝域DDD的制定由具体情况决定。

为了便于数学上的处理,又引入检验函数φ(x)\varphi(\boldsymbol x)φ(x)的概念,它与检验是一一对应的,如果φ(x)=1\varphi(\boldsymbol x)=1φ(x)=1则说明X\boldsymbol XX的观测值x\boldsymbol xx落入拒绝域内,需要拒绝原假设H0H_0H0,即
φ(x)={1,x∈D;0,x∉D. \varphi(\boldsymbol x)=\left\{ \begin{array}{l} 1,&\boldsymbol x\in D;\\ 0,&\boldsymbol x\notin D. \end{array} \right. φ(x)={1,0,xD;x/D.
对于只取0,10,10,1两个值的检验函数,称为非随机化检验,一般我们提到的检验数都是非随机化检验。

如果对于某些样本有0<φ(x)<10<\varphi(\boldsymbol x)<10<φ(x)<1,则称φ(x)\varphi(\boldsymbol x)φ(x)为随机化检验。随机化检验的检验函数可能是
φ(x)={0,T(x)>c,r,T(x)=c,1,T(x)<c. \varphi(\boldsymbol x)=\left\{ \begin{array}{l} 0, &T(\boldsymbol x)>c,\\ r, &T(\boldsymbol x)=c,\\ 1, &T(\boldsymbol x)<c. \end{array} \right. φ(x)=0,r,1,T(x)>c,T(x)=c,T(x)<c.
如果此时出现了T(x)=cT(\boldsymbol x)=cT(x)=c的情况,可以作一次成功概率为rrr的实验,根据实验结果来决定是否接受检验。

求解假设检验问题的步骤,是提出假设(H0H_0H0H1H_1H1)、导出否定域DDD确定检验统计、求出检验统计量的临界值、得出结论。

2.两类错误

在假设检验问题中,可能会遇到如下两类错误:

  1. 第一类错误:假设H0H_0H0本来是对的,但样本却落入拒绝域DDD使得我们认为假设H0H_0H0是错的从而拒绝了H0H_0H0。这类错误称为去真错误。
  2. 第二类错误:假设H0H_0H0本来是错的,但样本却落入接受域Dˉ\bar DDˉ使我们认为假设H0H_0H0是对的从而接受了H0H_0H0。这类错误称为取伪错误。

在每一个具体的场合,两类错误只会犯一个,并且确定检验方式(拒绝域)后犯两类错误的概率也就确定了。希望犯错误的概率尽可能小,但是一般来说,在样本大小nnn固定的概率下,两类错误的犯错概率是负相关的。

功效函数:设φ(x)\varphi(\boldsymbol x)φ(x)H0:θ∈Θ0⟷H1:θ∈Θ1H_0:\theta\in\Theta_0\longleftrightarrow H_1:\theta\in\Theta_1H0:θΘ0H1:θΘ1的检验函数,则称
βφ(θ)=Pθ{用检验φ否定了H0}=Eθ[φ(X)],θ∈Θ \beta_\varphi(\theta)=\mathbf P_\theta\{\text{用检验$\varphi$否定了$H_0$}\}=E_\theta[\varphi(\boldsymbol X)],\theta\in\Theta βφ(θ)=Pθ{用检验φ否定了H0}=Eθ[φ(X)],θΘ
φ\varphiφ的功效函数,也称效函数或势函数。基于效用函数表示两类错误的犯错概率,可以表示为
αφ∗(θ)={βφ(θ),θ∈Θ0,0,θ∈Θ1,βφ∗(θ)={0,θ∈Θ0,1−βφ(θ),θ∈Θ1. \alpha_\varphi^*(\theta)=\left\{ \begin{array}{l} \beta_\varphi(\theta),&\theta\in\Theta_0,\\ 0,&\theta \in\Theta_1, \end{array} \right. \quad \beta_\varphi^*(\theta)=\left\{ \begin{array}{l} 0,&\theta\in\Theta_0,\\ 1-\beta_\varphi(\theta),&\theta\in\Theta_1. \end{array} \right. αφ(θ)={βφ(θ),0,θΘ0,θΘ1,βφ(θ)={0,1βφ(θ),θΘ0,θΘ1.
Neyman-Pearson准则:在保证犯第一类错误的概率不超过指定数值α∈(0,1)\alpha\in(0,1)α(0,1)的检验中,寻找犯第二类错误概率尽可能小的检验。

检验的显著性水平:设φ\varphiφ是一个检验而0<α<10<\alpha<10<α<1,如果φ\varphiφ犯第一类错误的概率总是不超过α\alphaα,则称α\alphaα是检验φ\varphiφ的一个水平,称φ\varphiφ是显著性水平为α\alphaα的检验。这里显著性水平是不唯一的,所以取所有水平中最小的那个为真实水平,即sup⁡{βφ(θ),θ∈Θ0}\sup\{\beta_\varphi(\theta),\theta\in\Theta_0\}sup{βφ(θ),θΘ0}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值