一、p值的概念

下图中,μ0 表示整个地区的总体均值,μ 表示整个矿区的整体均值, X ‾ \overline{X} X 表示矿区抽样的均值
- H0是无效假设(原假设),即,矿区的均值和该地区的均值其实是一样的,只是因为抽样误差而导致的(即矿区的样本是整个地区样本的一部分)
- H1是备择假设,即,矿区的数据分布和整个地区的数据分布是完全不同的,两者均值本身就不相等。所以从矿区中抽样出来的均值自然和整个地区的均值不同,即矿区影响了新生儿头围的发育



如下图所示,S 表示标准差,n 表示样本数


注意,这里需要对 μ 取绝对值,即 μ=2.273,2.273是介于 1.96 到 2.58 之间,所以 p 值介于 0.01 到 0.05 之间
- μ 越大,p 越小;μ越小,p越大

接受 H1 即表示:矿区新生儿的头围,和全地区的数据,是不一致的

如下图所示,即表示,H0的零假设其实就是假设 “没有差别”,拒绝了 “没有差别” 的假设,那结论自然就是 “有差别”


参考:【统计】从P值到6σ(六西格玛)质量控制(P值与Z值,与置信水平的关系,python scipy 计算)

下图中,z=1.96 表示,距离均值 1.96 个标准差

In [88]

文章介绍了P值的概念,它用于检验假设,当P值小于0.05时,通常拒绝无效假设。T检验用于确定两个样本均值的差异,自由度df影响T分布。在AB实验中,P值小于0.05意味着实验组与基线有显著差异。文章还讨论了自由度的选择和计算方法。


&spm=1001.2101.3001.5002&articleId=129825615&d=1&t=3&u=3f4a6fd92d144302ae394fdb9708dfdc)
4369

被折叠的 条评论
为什么被折叠?



