SVM线性分类推导

SVM通过最大化间隔选择最优分类超平面,避免了感知机中分类超平面的不唯一性。函数间隔和几何间隔被引入,其中几何间隔对比例变化不变,成为分类依据。通过凸二次规划问题确定最优解,支持向量决定了超平面。进一步,原始问题转换为对偶问题简化求解,最终得到最优参数w和b的表达式,支持向量在此过程中起到关键作用。

1. 原始问题

与感知机相似,SVM通过分类超平面划分数据集,分类超平面形式为:
在这里插入图片描述
但感知机中分类超平面是不唯一的,SVM以间隔最大为依据可以唯一确定最优分类超平面,其中函数间隔定义为:
在这里插入图片描述
然而当参数w和b成比例变化时,虽然分类超平面没有变化,但函数间隔却变化了,故又提出了几何间隔:
在这里插入图片描述
即使w和b成比例变化,几何间隔也不会改变,故不会出现多个间隔对应同一分类超平面的情况,可用作分类依据。
求解最大间隔分类超平面过程如下:
在这里插入图片描述
在同一个分类超平面上,w和b的同比例变化并不会影响不等式约束,故可固定函数间隔为1,则上述过程可等价为如下凸二次规划问题:
在这里插入图片描述
从而求得最优解w和b得到最优超平面,其中支持向量为满足下式的实例点:
在这里插入图片描述
仅有支持向量对决定最优分类超平面起作用。

2. 对偶问题

再具体求解时可将如上原始问题转换为对偶问题便于求解,对偶问题形式如下:
在这里插入图片描述
推导过程为:
根据原始问题构建拉格朗日方程为:
在这里插入图片描述
具体问题即可转化为求解对偶问题
在这里插入图片描述
首先求解最小问题,对w和b进行偏导计算后可得
在这里插入图片描述
将其回代到拉格朗日方程可得
在这里插入图片描述
从而得到对偶形式,并可求得最优参数w和b的表达式为:
在这里插入图片描述
支持向量即是满足拉格朗日因子a>0的实例点。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值