朴素贝叶斯算法原理数学公式案例及python代码

本文详细介绍了朴素贝叶斯算法,包括贝叶斯定理的案例解析、算法原理、参数估计(极大似然估计与贝叶斯估计),并探讨了条件独立假设对分类准确率的影响。同时提供了朴素贝叶斯分类器的Python代码示例,推荐学习机器学习理论的读者参考。

本文先通过介绍简单的案例来了解贝叶斯定理。案例如下:

例: 一口袋里有3只红球,2只白球,采取不放回方式摸取,求:(1) 第一次摸到红球(记做A)的概率; (2) 第二次摸到红球(记做B)的概率; (3) 已知第二次摸到了红球,求第一次摸到的是红球的概率。

解: (1) P ( A ) = 0.6 P(A)=0.6 P(A)=0.6 #这就是先验概率

(2) P ( A ’ ) = 0.4 , P ( B ∣ A ) = 0.5 , P ( B ∣ A ′ = 0.75 , P ( B ) = P ( B ∣ A ) ∗ P ( A ) + P ( B ∣ A ’ ) ∗ P ( A ′ ) = 0.6 P(A^{’})=0.4,P(B|A)=0.5,P(B|A^{'}=0.75,P(B)=P(B|A)*P(A)+P(B|A^{’})*P(A^{'})=0.6 P(A)=0.4P(BA)=0.5,P(BA=0.75,P(B)=P(BA)P(A)+P(BA)P(A)=0.6

(3) P ( A ∣ B ) = P ( B ∣ A ) ∗ P ( A ) P ( B ) = 0.5 P(A|B)= \frac{P(B|A)*P(A)}{P(B)}=0.5 P(AB)=P(B)P(BA)P(A)=0.5 #这就是后验概率

朴素贝叶斯(naive Bayes)法是基于贝叶斯定力与特定条件独立假设的分类方法。对于给定的数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;然后基于此模型,对给定的输入 x x x ,利用贝叶斯定理求出后验概率最大的输出 y y y

1 朴素贝叶斯的学习与分类

设输入空间 χ ⊆ R n \chi \subseteq R^{n} χRn n n n 维向量的集合,输出空间为类标记集合 Y = c 1 , c 2 , . . . , c K Y={c_1,c_2,...,c_K} Y=c1,c2,...,cK 。输入为特征向量 x ∈ χ x \in \chi xχ ,输出为类标记(class label) y ∈ Y y \in Y yY X X X 是定义在输入空间 χ \chi χ 上的随机变量, Y Y Y 是定义在输出空间上的随机变量。 P ( X , Y ) P(X,Y) P(X,Y) X X X Y Y Y 的联合概率分布。 训练数据集 T T T P ( X , Y ) P(X,Y) P(X,Y) 独立同分布产生。
T = ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N ) T={(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{N},y_{N})} T=(x1,y1),(x2,y2),...,(xN,yN)
朴素贝叶斯法通过训练数据集学习联合概率分布 P ( X , Y ) P(X,Y) P(X,Y) 。具体的,学习以下先验概率分布及条件概率分布。先验概率分布
P ( Y = C k ) , k = 1 , 2 , . . . , K P(Y=C_k),k=1,2,...,K P(Y=Ck),k=1,2,...,K
条件概率分布
P ( X = x ∣ Y = c k ) = P ( X ( 1 ) = x 1 , . . . , X ( n ) = x n ∣ Y = c k ) , k = 1 , 2 , . . . , K P(X=x|Y=c_k)=P(X^{(1)}=x^{1},...,X^{(n)}=x^{n}|Y=c_k),k=1,2,...,K P(X=xY=ck)=P(X(1)=x1,...,X(n)=xnY=ck),k=1,2,...,K
于是学习到联合概率分布 P ( X , Y ) P(X,Y) P(X,Y)

条件概率分布 P ( X = x ∣ Y = c k ) P(X=x|Y=c_k) P(X=xY=ck) 有指数级数量的参数,其估计实际是不可行的。事实上,假设 x ( j ) x^{(j)}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值