今天写“t检验”。这个大家也都是很熟悉的。用的也相当多,两组均值比较用t检验,背的基本滚瓜烂熟。还是写一写,看看有没有些新的启发。
先看一个特别简单的场景。假设你是一家制药公司的研究员,你们研发了一款新药,声称可以降低血压。现在,你想知道这个药到底有没有效果。
你知道,正常人的平均血压是120。你做了一个实验:找了一组志愿者,让他们服用这个新药一段时间,然后测量他们的血压。
结果发现,这组志愿者的平均血压是115。
好,现在问题来了:你能直接下结论说,“新药有效,因为它让平均血压降到了115”吗?
当然不能。
为什么?因为即使是随机找一群没有吃药的人,他们的平均血压也不可能正好是120。你可能找到的这群人,本身就比较健康,平均血压就是115。换句话说,我们看到的这个“115”的平均值,到底是新药带来的真实效果,还是随机的巧合呢?
我们现在想做的,就是去区分这两种可能性。回一下奥好多的统计方法都在干这个事情奥,比如方差分析。
从Z检验到T检验
如果,我们特别“有钱”,可以对全世界所有人的血压数据都进行普查,我们就能知道全世界所有人的血压标准差(Standard Deviation)是多少。有了这个“黄金标准”,我们就可
订阅专栏 解锁全文

339

被折叠的 条评论
为什么被折叠?



