Advanced Topics in Statistical Machine Learning 笔记04:Bayesian Networks as Classifiers
在本节中,我们来看如何将 Bayesian Network 作为分类器 (Classifier) 来使用。这里我们仍然使用一个具体的例子来进行理解:
假设我们已有一个针对乳腺癌 (Breast Cancer) 的诊断模型,该模型是一个贝叶斯网络:
我们的目标是使用给定的一系列乳腺摄影结果 (Mammography Results) 来预测病人是否患有乳腺癌。
和一般的分类任务一样,我们需要将变量 (Variables) 划分为两个部分:
- Class / Label / Query Variable:在本例中就是 {Breast Cancer},它有三个取值:No, Insitu, Invasive
- Attributes:本例中的其他所有变量都是 Attributes。在贝叶斯网络中就是 Evidence,用以计算 Breast Cancer 的概率
因此,我们只需要将 Q 设为 {Breast Cancer},其他所有变量设为 Evidence 进行 MPE 查询即可得到答案。我们需要知道的是,贝叶斯网络能够自然地处理缺失数据 (Missing Data),如果在查询中有 Evidence 缺失,可以使用 MAP 查询。我们在前一章已经对这两种查询方式进行了介绍,最大的区别就在于 MPE 会涉及网络中的所有变量 (Variables),但是 MAP 只会使用一部分,因此它支持对缺少某些 Evidence 情况的计算。只是 MAP 相比 MPE 的开销会更大,因为它需要消除哪些未被使用的变量。

本文探讨了贝叶斯网络作为分类器的使用,特别是在完备数据的分类上下文中。通过马尔科夫毯的概念,简化了变量选择,降低了计算复杂度。此外,介绍了朴素贝叶斯分类器的原理和参数估计方法,以及树增强贝叶斯分类器如何处理更复杂的依赖关系。在实际应用中,贝叶斯网络提供了有效且高效的分类手段。


412

被折叠的 条评论
为什么被折叠?



