Advanced Topics in Statistical Machine Learning 笔记04:Bayesian Networks as Classifiers

本文探讨了贝叶斯网络作为分类器的使用,特别是在完备数据的分类上下文中。通过马尔科夫毯的概念,简化了变量选择,降低了计算复杂度。此外,介绍了朴素贝叶斯分类器的原理和参数估计方法,以及树增强贝叶斯分类器如何处理更复杂的依赖关系。在实际应用中,贝叶斯网络提供了有效且高效的分类手段。

在本节中,我们来看如何将 Bayesian Network 作为分类器 (Classifier) 来使用。这里我们仍然使用一个具体的例子来进行理解:

假设我们已有一个针对乳腺癌 (Breast Cancer) 的诊断模型,该模型是一个贝叶斯网络:
在这里插入图片描述
我们的目标是使用给定的一系列乳腺摄影结果 (Mammography Results) 来预测病人是否患有乳腺癌。

和一般的分类任务一样,我们需要将变量 (Variables) 划分为两个部分:

  • Class / Label / Query Variable:在本例中就是 {Breast Cancer},它有三个取值:No, Insitu, Invasive
  • Attributes:本例中的其他所有变量都是 Attributes。在贝叶斯网络中就是 Evidence,用以计算 Breast Cancer 的概率

因此,我们只需要将 Q 设为 {Breast Cancer},其他所有变量设为 Evidence 进行 MPE 查询即可得到答案。我们需要知道的是,贝叶斯网络能够自然地处理缺失数据 (Missing Data),如果在查询中有 Evidence 缺失,可以使用 MAP 查询。我们在前一章已经对这两种查询方式进行了介绍,最大的区别就在于 MPE 会涉及网络中的所有变量 (Variables),但是 MAP 只会使用一部分,因此它支持对缺少某些 Evidence 情况的计算。只是 MAP 相比 MPE 的开销会更大,因为它需要消除哪些未被使用的变量。

完备数据的分类(Classification of Complete Data)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值