孪生双子支持向量机（TWSVM）

最新推荐文章于 2023-09-19 15:06:02 发布

原创

最新推荐文章于 2023-09-19 15:06:02 发布 · 8.4k 阅读

标签

#python #机器学习

孪生双子支持向量机（TWSVM）

线性可分支持向量机

孪生双子支持向量机与广义特征支持向量类似都是求取两个非平行的超平面来分离数据。（广义特征支持向量机https://blog.csdn.net/LIUGXIN/article/details/112132081）但是他们在本质上是不同的。TWSVM对中的两个二次规划问题都有一个典型的SVM公式。
通过求解以下公式得到TWSVM分类器二次规划问题：

在这里插入图片描述

在这里插入图片描述
这里的c1、c2 为常数且 c1、c2 > 0，e1、e2为合适维度的单位向量。
该算法找到两个超平面，每一类对应一个超平面，并根据该超平面对给定点最接近的点进行分类。上式目标函数的第一项为超平面到每一类数据距离的最小平方和。因此，最小化目标函数意味着，使一个超平面尽量离其中的一类数据近（class 1），约束要求超平面距离另一类数据(class -1)的距离至少大于1。当超平面距离小于最小距离1时，使用一组误差变量来测量误差。目标函数的第二项目标函数最小化误差变量的总和，试图最小化由于数据属于-1类而错分类的点。

TWSVM构建了两个更小的QPP问题，所以计算速度要比SVM更快，大约为：
在这里插入图片描述
针对TWSVM1构造拉格朗日函数：

α = (α1，α2…αm1)T，β = (β1，β2…βm2)T，解得TWSVM1的KKT条件为：

因为β>0,则 0< α <c1,前两个式子结合得到

使：

参数向量u = [w(1),b(1)]T，上式可以写为：

引入正则化项得到：
在这里插入图片描述
为了方便以下未添加正则化项，根据KKT条件，得到TWSVM1的对偶式如下：

TWSVM2与TWSVM1相同，对偶式如下：

P=[A e1]，Q=[B e2]，参数向量v = [w(2),b(2)]T，得到：

HT H和QTQ矩阵的大小是(n+1)x(n+1)，一般来说，n应该远远小于样本数量。
如何判断新的数据属于哪一类呢？
解上面矩阵，得到两个超平面
在这里插入图片描述
判断新的样本点距离那个超平面更接近，就将新的超平面分为相应的类。

| |代表的是点到平面的垂直距离。

非线性核分类

对于孪生双子支持向量机不是从线性扩展而来，而是直接从核出发构造优化问题。
补充：对于这个怎么得来的可能有些人不好理解，这儿可以看做是先对非线性数据进行核处理，也就是将非线性数据升到一个高维度中，在这个维度中，数据是线性可分的，然后在对此时的数据进行分类。
在这里插入图片描述
K为一个适合的核函数，可以选择线性核，高斯核等。
使用线性核：

引出优化问题：

得到KKT条件：

进一步得到：

使：

参数向量：

进一步简写为：

得到其对偶式：

相应的我们得到TWSVM2的优化问题如下：
在这里插入图片描述
同理可得TWSVM2的对偶式：

得到两个超平面后，对新样本点的预测方式与线性的一样。

代码

代码参考github https://github.com/vivamoto/classifier/tree/master/svm

import numpy as np
import scipy.optimize as optimize
import cvxopt
class tw_svm():
    def __init__(self, X_train, y_train, c1=1, c2=1, kernel_type='rbf', b=1, c=1, d=2, sigma=3):
        self.X_train = X_train
        self.y_train = y_train

        # Kernel 设置
        self.kernel_type = kernel_type
        self.b = b  # 双曲正切的常数乘子
        self.c = c  # 多项式，切线和线性样条的常数和
        self.d = d  # 多项式的权重
        self.sigma = sigma  # RBF 和 ERBF 的 sigma
        # Twin SVM settings
        self.c1 = c1  # TW-SVM 软间隔 1
        self.c2 = c2  # TW-SVM 软间隔 2
        # SVM settings
        self.C = 10                 # soft margin
        self.solver = 'optimize'   # Quadratic problem solver. 'cvxopt' or 'optimize'
        # #
        # self.alpha = None           # 拉格朗如乘子 (SVM and LSSVM)
        # self.SV = None              # 支持向量
        # self.bias = 1               # 偏置
    # 计算核函数 k(x1, x2)
    def kernel(self, x1, x2):

        if x1.ndim == <