SPSS软件包中非参数检验方法的正确使用

游志颖 中国卫生统计 1999年第2期第16卷 计算机应用

  统计软件包SPSS给统计工作者提供了很大方便,SPSS for Windows版本推出后,使用者无需编写程序也可完成分析,使用更广泛了。然而,面对软件包提供的众多统计过程(或方法),有些使用者感到迷惘。针对这 种情况,本文就如何正确使用SPSS for Windows软件包中Nonparametric Tests过程清单提供的8个非参数检验过程(或方法)逐一介绍。

  一、Chi-Square

  Chi-Square是对单个样本作检验的推断方法,用于推断目前掌握的样本是否来自某特定分布总体,属拟合优度检验〔1〕。要求提供假定总体 的理论频数;默认总体为均匀分布时无需提供理论频数〔2〕。Chi-Square过程通过分析实际频数与理论频数吻合的程序来完成检验,因此特别适合于频 数资料的分析,也只接受和处理频数资料, 如病人经治疗后治愈、好转、有效和无效的人数总的说来是否相同(实为治愈、好转、有效和无效的概率或机会是否相同),成绩优、良、中、差的学生人数总的说 来是否相同,赞同某种观点的人数总的说来是否达到80%,等等。要求样本足够大,按观察值从小到大的顺序提供理论频数。理论频数通过主对话框中 Expected Values的Values选项提供,All categories equal是默认项,即均匀分布。若只想推断样本中某一范围内的频数是否来自某种特定分布总体,可通过主对话框中Expected Range的Use speciffied range选项提供范围的上、下限。上述理论频数需根据假定总体分布计算或问题的实际背景确定。

  二、Binomial

  Binomial过程对二值变量的单个样本作检验,推断总体中两类个体的比例是否分别为π和(1-π),π值通过Test Proportion选项提供,默认值是π=0.5〔2〕。可借助于主对话框中Define Dichotomy的Cut point选项提供截断点,将连续变量转化成二值变量作分析;若提供的变量已经是二值变量,则不需提供截断点。小样本时输出精确概率,大样本时输出正态近 似法的结果。显然,在大样本时,也可用Chi-Square过程完成。

  三、Runs

  Runs过程借助样本序列的顺序推断总体序列的顺序是否是随机的,属随机性检验〔3,4〕。过程将变量转化成二值变量后再作检验,转化时所用截 断点可以是Median、Mode、Mean或指定的数值,需通过Cut Point对话框指明截断点。结果中只输出正态近似法的P值,因此要求样本足够大,样本不大时应利用结果提供的信息查表作结论,不可直接用结果中的P值作 结论。Runs检验的基本思想也用于分析两个独立样本数据,推断两个总体的分布是否相同〔4〕,称Wald-Wolfowitz runs检验,见后文。

  四、1-Sample K-S

  1-Sample K-S过程也是对单个样本作分析,推断样本是否来自正态分布总体、或均匀分布总体、或Poisson分布总体,也属拟合优度检验。此方法是前苏联学者于本 世纪三十年代提出的,称为“Kolmogorov-smirnov”单一样本检验,又称Kolmogorov检验,K-S是Kolmogorov- Smirnov的缩写。此过程直接处理原始数据,一般认为其功效比Chi-Square检验高,且在样本不大时也可用〔3〕。结果中的Z是渐近统计量 〔5〕,大样本时α=0.05和α=0.01的界值分别是1.36和1.63,小样本时应读取结果中经验分布函数与理论分布函数的最大差值查界值表作结 论,不可直接利用结果中的P值作结论。此方法的基本思想还可用于推断两个独立样本是否来自相同的总体,详见下文。

  五、2 Independent Samples

  此过程用于推断两个独立样本是否来自相同的总体,有四种方法供选用,各方法间不全相同,现逐一介绍如下。

  1.Mann-Whitney U检验(又简称M-W检验),注重对分布的中心位置(平均水平)作检验,实际是检验H0:两样本所对应的总体具有相同的中心位置(中位数),属位置参数检 验,而不管两总体分布的形状如何,因此通常假定两总体分布的形状相同〔3〕,只有在这个前提下的中心位置相同才能说是两总体分布相同或两样本来自相同总 体;若不能明确两总体分布的形状是否相同,则不宜单独使用此方法作分析了事,应同时作K-S检验或W-W检验,并对全部结果作综合分析。因为此方法与目前 国内通用教材中的Wilcoxon Rank Sum检验法完全等价,故在结果中一并给出〔1〕。小样本时应读取精确概率作结论〔6〕。

  2.Kolmogorov-Smirnov Z检验(又简称K-S检验)是上述提到的Kolmogorov检验用于两个独立样本的情形,对全貌作检验。如果结论是两总体分布不相同,此方法尚不足以说 明是位置不同、变异程度不同还是偏度不同,这是报告结果时应注意的。结果中的Z也是渐近统计量,大样本时α=0.05和α=0.01的界值分别是1.36 和1.63,小样本时应读取结果中两个经验分布函数的最大差值查界值表作结论,不可直接利用结果中的P值作结论。

  3.Wald-Wolfowitz runs检验(又简称W-W检验)与K-S检验相似,也是对全貌作检验,但其功效不如后者;此方法实为Runs过程用于分析两个独立样本的情形。与K-S 检验类似,如果结论是两总体分布不相同,此方法尚不足以说明是位置不同、变异程度不同还是偏度不同,报告结果时也应注意。若两样本有相同观察值,结果中提 供最大和最小游程个数以及相应的P值,当依此两P值所作的结论相矛盾时,须计算平均游程个数,然后查表作结论或用正态近似法作检验。此过程自动地根据样本 大小给出确切概率或正态近似法的结果。

  4.Moses Test of Extreme Reactions检验注重于对分布范围(变异程度)作检验,实际是检验H0:两样本所对应的总体具有相同的分布范围〔1〕。要求样本足够大。笔者尚未见到在医学领域中使用此方法的例子。

  六、K Independent Samples

  此过程用于推断多个独立样本是否来自相同的总体,有两种方法供选用。

  1.Kroskal-Wallis H检验的是H0:多个样本对应的总体具有相同的中位数,属位置参数检验,是Mann-Whitney U检验的延伸。通常也假定两总体分布的形状相同。此方法就是目前国内通用

教材中的多个样本比较的秩和检验(H检验)。

  2.Median检验的H0与Kroskal-Wallis H检验相同,但通常情况下其功效不如后者;然而,在相同值很多时效果较好,此时使用者应选用Median检验〔1〕。

  七、2 Related Samples

  此过程用于推断两个相关样本是否来自相同的总体,有三种方法供选用。

  1.Wilcoxon检验属对称性检验,检验差值总体的对称中心是否为0,从而推断两样本是否来自中心位置相同的总体。这就是目前国内通用教材中的配对设计资料的符号秩和检验,使用者大多熟悉,不多赘述。应该注意的是,小样本时不可直接读取结果中的P值作结论,而应利用结果中的秩和统计量查表作结论〔6〕。

  2.Sign检验也属对称性检验,相比于Wilcoxon检验,此方法不考虑“+”或“-”差值的相对大小关系(即秩次),只检验差值总体中 “+”与“-”的个数是否相同,从而推断两样本是否来自中心位置相同的总体〔1,4〕。小样本时采用二项分布计算精确概率,大样本时采用正态近似法作检 验。通常在数据测量较粗糙、不精确时使用。效率不如Wilcoxon检验。若变量是二值的,其检验效果与McNemar检验完全相同。

  3.McNemar检验实为目前国内通用教材中关于配对四格表资料有无差别的b、c格比较的检验,因此只接受和处理二值变量。小样本时采用二项分布计算精确概率,大样本时采用大家熟悉的χ2检验。此时作Sign检验也可得到相同结果。

  对于两个相关样本数据,目前国内通用教材中大多有介绍Spearman相关系数rs的计算方法及其假设检验,SPSS将此分析方法与 Pearson相关系数r的分析、Kendall相关系数τ的分析归到一类,统一的Correlate过程中〔2〕,其中τ和rs的分析用在检验独立性时 是渐近等价的,在大样本时可认为是等价的〔7〕。

  八、K Related Samples

  此过程用于分析多个相关样本数据,以推断它们是否来自分布相同的总体。有三种方法供选用,现分别叙述如下。

  1.Friedman检验就是目前国内通用教材中关于随机区组设计资料的秩和检验。使用者大多熟悉,不加赘述。

  2.Kendall's W检验,是和谐性分析,W统计量称和谐性系数或一致性系数(coefficient of concordance),用于度量一致性好坏。对同一份数据作分析,Kendall's W检验拒绝H0与否和Friedman检验完全相同,但它们所检验的H0不相同〔7〕。如:N名教师同时对K名学生的作文评分,对这份样本数据同时作 Friedman检验和Kendall's W检验,两个检验的无效假设分别是“H0:这K名学生的作文水平相同”和“H0:教师不都认为某位学生作文水平比别的学生高或低(即教师的评分有高有低, 不和谐、没有一致性)”。可见,Kendall' W检验和Friedman检验既有联系又有区别,应根据要解决的问题正确使用,不应随意使用。

  3.Cochran's Q检验是McNemar法的推广,也只适用于二分变量数据。如:一批标本同时接种到4种培养基,根据病菌生长情况(有无生长,是二值变量)评价这4种培养 基培养的效果是否相同,此时需用Cochran's Q方法作分析〔8〕。要求样本足够大,其中Q统计量服从自由度为v=k-1的χ2分布,k是处理组数(如上述例子中的培养基种类数4)。

  (衷心感谢方积乾教授审阅初稿和提供宝贵的指导性意见)

  参考文献

  1.袁淑君,孟庆茂编.数据统计分析-SPSS/PC+原理及应用.北京:北京师范大学出版社,1995.

  2.卢纹岱等编著.SPSS for Windows从入门到精通.北京:电子工业出版社,1997.

  3.陈希孺,等.非参数统计.上海:上海科学技术出版社,1989.

  4.杨树勤,主编.中国医学百科全书*医学统计学.上海:上海科学技术出版社,1985.

  5.茆诗松,王静龙编.数理统计.上海:华东师范大学出版社,1990.

  6.杨树勤,主编.卫生统计学.北京:人民卫生出版社,1978

  7.T.P.海特曼斯波格著.杨永信译.基于秩的统计推断.长春:东北师范大学出版社,1995.

8.金丕焕主编.医用统计方法.上海:上海医科大学出版社,1993. 
一. 课程介绍本课程结合Python进行统计与数据分析的原理讲解与实战,涵盖了大部分统计&数据分析模型,特别是当前比较主流的算法:参数估计、假设检验、线性回归、广义线性回归、Lasso、岭回归、广义可加模型、回归样条等;机器学习经常用到的主成分分析、因子分析、典型相关分析、聚类分析等;各种非参数统计模型,包括非参数统计推断、尺度推断、位置推断、非参数核密度估计、非参数回归等。本课程主要针对有一定Python编程基础、即将毕业参加工作的的大三大四学生,或者已经参加工作需要提升自己数据分析能力以及转行从事IT行业尤其是数据&大数据分析工作的初入职场者,或者正在攻读硕博士学位需要学习和掌握量化研究方法的研究生。本课程对于即将从事机器学习、深度学习&人工智能相关工作的程序员也有很大帮助,有利于打好坚实的理论基础。二. 课程目录第0章 课程导学第1章 数据描述性分析1.1 描述统计量1.2 数据的分布1.3 概率分布函数的图形1.4 直方图、经验分布函数与QQ图1.5 多元数据的数据特征与相关性分析1.6 多元数据的基本图形表示第2章 参数估计2.1 点估计2.2 区间估计第3章 假设检验3.1 基本原理3.2 参数检验第4章 回归分析4.1 回归分析的概念与一元线性回归4.2 多元线性回归及统计量解析4.3 逐步回归与模型选择4.4 回归诊断4.5 广义线性回归4.6 非线性回归第5章 方差分析5.1 单因素方差分析5.2 双因素方差分析第6章 判别分析与聚类分析6.1 判别分析6.2 聚类分析第7章 主成分分析、因子分析与典型相关分析7.1 主成分分析7.2 因子分析7.3 典型相关分析第8章 非参数统计8.1 经验分布和分布探索8.2 单样本非参数统计推断8.3 两独立样本的位置与尺度判断8.4 多组数据位置推断8.5 分类数据的关联分析8.6 秩相关与分位数回归8.7 非参数密度估计8.8 一元非参数回归三. 讲师简介主讲人李进华博士,本、硕、博皆就读于武汉大学信息管理学院,2005年获博士学位进入211高校任教,2012年受聘为教授。从事信息管理与数据分析方面的教学、科研与系统开发工作20余年,具备深厚理论修养和丰富实战经验。是中国最早从事Java开发的程序员和Oracle数据库的DBA之一。曾带领团队开发《葛洲坝集团三峡工程指挥中心三期工程施工管理系统》、《湖北省财政厅国有企事业单位资产管理系统》等大型MIS。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值