在《判别分析概述》中,我们提到Fisher判别一般用于指标为定量资料的两类判别,Bayes判别多用于指标为定量资料的多类判别;最大似然判别和Bayes公式判别适用于指标为定性资料的两类或多类判别。
本期我们要学习的是Bayes公式判别,在此之前我们需要一起回顾一下Fisher判别和最大似然判别的基本原理:
Fisher判别是寻找一个合适的投影方向(线性组合)使样本投影在该方向时,投影(综合指标)类内变异极小化,类间变异极大化;
最大似然判别是以概率为依据,以独立事件的概率乘法定理得到判别对象归属于某类的概率。

Bayes公式判别
Bayes公式判别进行判别分析与最大似然判别的原理相似,都是以概率为依据,最大似然法的基础上引入了先验概率(prior probability),计算所判别的后验概率,即:

其中P(Yk)即为第k类出现的概率,或称为先验概率。
按柠檬精的理解,上面这条公式中分子就是在计算最大似然概率(具体小伙伴可移步SPSS学堂上期内容,在此不作赘述)是再乘上某一类出现的概率(先验概率),分母则是所有类别出现的概率总和而已。
Bayes公式判别的规则与最大似然法相同,都是判别为最大概率的类。
【扩展】 贝叶斯框架下的概率理论与我们平时接触的概率论完全不同,它认为概率是个人的主观概念,表明人对某个事物发生的相信程度,它解决的是来自外部的信息与大脑内部信念的交互关系。贝叶斯分析是对于由证据的积累来推测一个事物发生的概率,当我们要预测一个事物,需要根据历史资料或主观判断确定一个先验概率(大脑内部信念),然后在新证据不断积累(外部信息)的情况下调整修正获得后验概率(外部信息与大脑内部信念交互),整个通过积累证据来得到一个事件发生概率的过程便称为贝叶斯分析。

接下来,我们再看一下上期对4种类型的阑尾炎作鉴别诊断的例子,补充这5668例阑尾炎病人4种类型的构成比作为先验概率估计(也就是大脑内部信念):卡他性阑尾炎20%,蜂窝织炎型阑尾炎 50%,坏疽型阑尾炎 25%,腹膜型阑尾炎 5%(根据历史资料,我们确定4种类型的阑尾炎发生概率由大到小分别是:蜂窝织炎型、坏疽型、卡他性和腹膜型)。
表1 5668例不同型阑尾炎病例的症状发生频率(%)

如某病例昨晚开始出现右下腹疼痛、呕吐的症状,大便正常。经检查,右下腹压痛,肌性防御(+),反跳痛(+),体温36.6℃,白细胞23700。
我们依次计算待判病例属于的第一类卡塔型阑尾炎后验概率式中的分子:
P(Y1)·P(X1(S1)|Y1)P(X2(S2)|Y1)…P(X7(S7)|Y1) = 0.2×0.57×0.11×0.72×0.95×0.08×0.61×0.08 = 0.000033
同理可得,其余三类后验概率式中的分子0.000900,0.001175,0.000075,分母则是这四个分子的总和0.002183。
最后,根据Bayes公式判别计算出待判病例属于四类阑尾炎的后验概率分别为0.015,0.412,0.538,0.034;其中最大后验概率为0.538,即病例诊断为第3类坏疽型阑尾炎。

小结
Bayes公式判别是在最大似然法的基础上,将先验概率(大脑主观判断或历史资料确定)加以考虑,计算后验概率,可用于指标为定性资料的两类或多类判别。
本文介绍了Bayes公式判别,它是基于概率的判别方法,与最大似然判别类似,但考虑了先验概率。通过举例说明如何运用Bayes公式进行两类或多类判别,特别是用在定性资料的情况。在阑尾炎类型的鉴别诊断中,展示了如何计算后验概率以做出最佳判断。

2887

被折叠的 条评论
为什么被折叠?



