Advanced Topics in Statistical Machine Learning 笔记04：Bayesian Networks as Classifiers

最新推荐文章于 2021-08-24 09:15:50 发布

原创

最新推荐文章于 2021-08-24 09:15:50 发布 · 582 阅读

·

0

·

标签

#朴素贝叶斯算法

本文探讨了贝叶斯网络作为分类器的使用，特别是在完备数据的分类上下文中。通过马尔科夫毯的概念，简化了变量选择，降低了计算复杂度。此外，介绍了朴素贝叶斯分类器的原理和参数估计方法，以及树增强贝叶斯分类器如何处理更复杂的依赖关系。在实际应用中，贝叶斯网络提供了有效且高效的分类手段。

Advanced Topics in Statistical Machine Learning 笔记04：Bayesian Networks as Classifiers

完备数据的分类（Classification of Complete Data）
朴素贝叶斯分类器（Naive Bayes Classifier - NBC）
参数估计（Parameter Estimation）
树增强贝叶斯分类器（Tree-augmented Bayes Classifier）
关于贝叶斯网络的学习

在本节中，我们来看如何将 Bayesian Network 作为分类器 (Classifier) 来使用。这里我们仍然使用一个具体的例子来进行理解：

假设我们已有一个针对乳腺癌 (Breast Cancer) 的诊断模型，该模型是一个贝叶斯网络：

我们的目标是使用给定的一系列乳腺摄影结果 (Mammography Results) 来预测病人是否患有乳腺癌。

和一般的分类任务一样，我们需要将变量 (Variables) 划分为两个部分：

Class / Label / Query Variable：在本例中就是 {Breast Cancer}，它有三个取值：No, Insitu, Invasive
Attributes：本例中的其他所有变量都是 Attributes。在贝叶斯网络中就是 Evidence，用以计算 Breast Cancer 的概率

因此，我们只需要将 Q 设为 {Breast Cancer}，其他所有变量设为 Evidence 进行 MPE 查询即可得到答案。我们需要知道的是，贝叶斯网络能够自然地处理缺失数据 (Missing Data)，如果在查询中有 Evidence 缺失，可以使用 MAP 查询。我们在前一章已经对这两种查询方式进行了介绍，最大的区别就在于 MPE 会涉及网络中的所有变量 (Variables)，但是 MAP 只会使用一部分，因此它支持对缺少某些 Evidence 情况的计算。只是 MAP 相比 MPE 的开销会更大，因为它需要消除哪些未被使用的变量。

完备数据的分类（Classification of Complete Data）

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。