66、利用R进行卡方检验的全面指南

利用R进行卡方检验的全面指南

1. 卡方检验的假设

卡方检验与其他多数检验不同,它不依赖于数据连续且呈正态分布等假设,因为分类数据并非连续数据,不可能呈正态分布。不过,卡方检验仍有两个重要假设:
- 数据独立性 :和本书中遇到的大多数检验一样,卡方检验也要求数据独立。为了使卡方检验有意义,每个人、物品或实体只能对应列联表中的一个单元格。因此,不能将卡方检验用于重复测量设计。例如,如果先训练一些猫用食物奖励看它们是否会跳舞,然后再用情感奖励训练同一批猫看它们是否会跳舞,就不能用皮尔逊卡方检验来分析这些数据。
- 期望频数大于5 :尽管在较大的列联表中,允许最多20%的期望频数低于5,但这会导致统计效力下降,可能无法检测到真实的效应。即使在较大的列联表中,期望频数也不应低于1。如果遇到这种情况,可以考虑使用费舍尔精确检验。

此外,当样本量足够大时,单元格频数的微小差异也可能导致变量之间的统计显著关联。因此,必须查看行和列的百分比来解释得到的任何效应,这些百分比能比频数本身更好地反映数据模式。

2. 使用R进行卡方检验的数据输入

分类数据有两种输入方式:输入原始分数或输入加权个案。

2.1 输入原始分数

输入原始分数意味着数据编辑器的每一行代表一个有数据的实体。以猫的例子来说,每一行代表一只猫。需要创建两个编码:“Training”和“Dance”。“Training”包含两个值,分别表示食物奖励和情感奖励;“Dance”根据猫是否跳舞包含“Yes”或“No”。总共有200只猫,因此有200行数据。可以通过设置工作目录并执行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值