今天写写方差分析,很简单的方法,大家都会用,都知道什么时候用,也都用的挺溜,看看能不能写出点新意,启发大家。
方差分析到底想解决什么问题?
我们先从一个最简单、最常见的问题开始。假设我们想知道,喝不同种类的咖啡,会不会影响我们的学习效率。我们找了三组同学:
-
• 第一组,让他们喝黑咖啡。
-
• 第二组,让他们喝拿铁。
-
• 第三组,什么都不喝,作为对照组。
然后,我们让这三组同学都去做一套数学题,看看他们的平均得分。
-
• 喝黑咖啡的同学,平均分是 85分。
-
• 喝拿铁的同学,平均分是 80分。
-
• 对照组的同学,平均分是 75分。
现在问题来了,我们能直接就下结论说:“黑咖啡的学习效果最好!”吗?
当然不能。因为我们知道,就算这三组同学都喝同一种饮料,他们的得分也不会一模一样。这里涉及到变异的来源:随机的噪音,还是真实的影响?比如,喝黑咖啡的那组,可能有一个学霸考了95分,一个马大哈只考了75分,平均下来才是85分。这个分数高高低低,不是因为他们喝了黑咖啡导致的,而是因为他们本身的学习基础、做题习惯、当天状态等等各种随机因素导致的。
这种“高高低低”的现象,我们把它叫做变异(Variation)。
方差分析这个方法,它厉害就在它能把我们看到的所有变异,一层一层地剥开,然后问一个核心问题:我们观察到的这些差异,到底是“随机的噪音”,还是由我们的“干预”(喝不同咖啡)带来的?
订阅专栏 解锁全文

1121

被折叠的 条评论
为什么被折叠?



