统计学 假设检验

假设检验

假设检验的基本原理

提出假设

假设检验:先对总体提出某种假设(例如对总参数提出一个假设值),然后利用样本信息判断这一假设是否成立
原假设:也称零假设,通常是研究者想搜集证据予以推翻的假设,记为 H 0 H_{0} H0 ;原假设表达的含义是指参数没有变化、变量之间没有联系或总体分布与一理论分布并无差异,所以常有 = = =。设参数的假设值为 μ 0 \mu_{0} μ0,原假设常写成 H 0 :   μ = μ 0 ;   H 0 :   μ ≥ μ 0 ;   H 0 :   μ ≤ μ 0 H_{0}:\,\mu=\mu_{0};\,H_{0}:\,\mu\geq\mu_{0};\,H_{0}:\,\mu\leq\mu_{0} H0:μ=μ0;H0:μμ0;H0:μμ0 。原假设最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝原假设。
备则假设:通常是研究者想搜集证据予以支持的假设,记为 H 1 H_{1} H1 H a H_{a} Ha;备则假设表达的含义是指参数有变化、变量之间有联系或总体分布与一理论分布有差异。因此备则假设常写成 H 1 : μ ≠ μ 0 ;   H 1 :   μ > μ 0 ;   H 1 :   μ < μ 0 H_{1}:\mu\not=\mu_{0};\,H_{1}:\,\mu>\mu_{0};\,H_{1}:\,\mu<\mu_{0} H1:μ=μ0;H1:μ>μ0;H1:μ<μ0。备则假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,支持备则假设。

  • 双侧检验:也称双尾检验,指没有特定方向性的备则假设,含有符号 ≠ \not= =
  • 单侧检验:也称单尾检验,指有特定方向性的备则假设,含有符号 > > >右侧检验)或 < < <左侧检验
    (备则假设就是我们为什么要检验的理由,例如我们检验一个车间生产的零件是否符合标准,我们肯定是认为它不符合标准才需要检验,要是我们认为它标准的话就没必要检验了。因此原假设是符合标准,备择假设是不符合标准)

作出决策

两类错误

  • 第 I 类错误:也称为 α \alpha α 错误,原假设是正确的却拒绝了原假设,概率记为 α \alpha α
  • 第 II 类错误:也称为 β \beta β 错误,原假设是错误的却没有拒绝了原假设,概率记为 β \beta β

在样本量一定的情况下, α \alpha α β \beta β 是负相关的;要是 α \alpha α β \beta β 同时减小只能增大样本量。

显著性水平:即 α \alpha α,通常是人们事先指定的犯第一类错误的概率的最大允许值;一般情况下,人们认为第一类错误的后果更严重,因此会取一个较小的 α \alpha α 值,实际中常用 α = 0.01 \alpha=0.01 α=0.01 α = 0.05 \alpha=0.05 α=0.05 α = 0.1 \alpha=0.1 α=0.1

用统计量决策:首先要根据样本观测结果计算对原假设作出决策的检验统计量。例如要检验总体均值,则可以对样本均值标准化(标准化检验统计量);然后根据实现确定好的显著性水平 α \alpha α 划定拒绝域:
标准化检验统计量 = 点估计 − 假设值 点估计量的标准差 标准化检验统计量=\frac{点估计-假设值}{点估计量的标准差} 标准化检验统计量=点估计量的标准差点估计假设值

请添加图片描述

决策准则:

  • 双侧检验:|统计量|>临界值,拒绝原假设
  • 左侧检验:统计量的值<-临界值,拒绝原假设
  • 右侧检验:统计量的值>临界值,拒绝原假设

P P P 值决策:如果原假设是正确的,所得到的样本结果会像实际观测结果那么极端或者更极端的概率称为 P P P ,也称观察到的显著性水平

请添加图片描述

决策准则:

  • 如果 P < α P\lt\alpha P<α ,则拒绝 H 0 H_0 H0
  • 如果 P > α P>\alpha P>α ,则不拒绝 H 0 H_0 H0

注意

  • P P P 值是关于数据的概率,与原假设对错的概率无关; P P P 值反映的是某个总体的所有样本中某一类数据出现的经常程度。就是说当原假设是正确时, P P P 值就是得到目前这个样本的概率。

(书上解释的跟屎一样;比如我们要检验全小学生月平均生活支出是否为 2000 2000 2000 元, H 0 :   μ = 2000 H_0:\,\mu=2000 H0:μ=2000 ,我们统计出来 X ˉ = 1750 \bar{X}=1750 Xˉ=1750 P = 0.02 P=0.02 P=0.02 α = 0.05 \alpha=0.05 α=0.05 ,说明如果平均支出真的是 2000 2000 2000 的话,那么我们抽到 1750 1750 1750 的概率只有 0.02 0.02 0.02,太小了,所以可以拒绝原假设)

  • P P P 值不一定要和显著性水平 α \alpha α 进行比较,我们可以认为 P P P 值越小,拒绝原假设的理由就越充分,一般要求 P P P 不大于 0.1 0.1 0.1
  • P P P 值决策优于统计量决策, P P P 值其实是实际上犯 I 类错误的概率。

表述决策结果

  • 假设检验不能证明原假设正确,“不拒绝”不代表“接受”,接受 H 0 H_0 H0 的风险由 β \beta β 衡量;
  • 拒绝原假设时,称样本结果在“统计上是显著的”,“显著的”意思是“非偶然的”,但统计上显著不等于有实际意义

一个总体参数的检验

总体均值的检验

大样本的检验:样本均值经标准化后,可认为服从标准正态分布,因而采用正态分布的检验统计量:

  • 当总体方差 σ 2 \sigma^2 σ2 已知时,总体均值检验统计量为:

Z = X ˉ − μ 0 σ / n Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} Z=σ/n Xˉμ0

  • 当总体方差 σ 2 \sigma^2 σ2 未知时,可以用样本方差 S 2 S^2 S2 代替,得到总体均值检验统计量为:

Z = X ˉ − μ 0 S / n Z=\frac{\bar{X}-\mu_0}{S/\sqrt{n}} Z=S/n Xˉμ0

小样本的检验

  • 当总体方差 σ 2 \sigma^2 σ2 已知时,即使是在小样本的情况下,样本均值经标准化后仍然服从标准正态分布,总体均值检验统计量为:

Z = X ˉ − μ 0 σ / n   Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\ Z=σ/n Xˉμ0 

  • 当总体方差未知时,检验统计量满足 t 分布(自由度为 n − 1 n-1 n1 ),通常称为 t 检验

t = X ˉ − μ 0 S / n t=\frac{\bar{X}-\mu_0}{S/\sqrt{n}} t=S/n Xˉμ0

总体比例的检验

大样本的检验:样本比例经过标准化后近似服从标准正态分布,因此总体比例检验统计量为:( π 0 \pi_0 π0 可以是我们猜测的比例)
Z = p − π 0 π 0 ( 1 − π 0 ) n Z=\frac{p-\pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} Z=nπ0(1π0) pπ0

总体方差的检验

总体方差的检验,不论样本量 n n n 是大是小,都要求总体服从正态分布。总体方差检验统计量为:( σ 0 \sigma_0 σ0 可以是我们猜测的方差)
χ 2 = ( n − 1 ) S 2 σ 0 2 \chi^2=\frac{(n-1)S^2}{\sigma_0^2} χ2=σ02(n1)S2
χ 2 \chi^2 χ2 自由度为 n − 1 n-1 n1 )由于是不对称分布,因此我们采取等尾区间:

请添加图片描述

两个总体参数的检验

两个总体均值之差的检验

(常用于比如比较两个相似环境下产生的结果是否相同,取 H 0 :   ( μ 1 − μ 2 ) = 0 H_0:\,(\mu_1-\mu_2)=0 H0:(μ1μ2)=0

独立大样本的检验:两样本均值之差经标准化后满足正态分布( ( μ 1 − μ 2 ) (\mu_1-\mu_2) (μ1μ2) 为我们猜测的样本均值之差的值)

  • 当总体方差 σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22 已知时,总体均值检验统计量为:

Z = ( X 1 ˉ − X 2 ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{(\bar{X_1}-\bar{X_2})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} Z=n1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Air浩瀚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值