模型融合Blending 和 Stacking

本文深入探讨了模型融合在机器学习中的应用,详细介绍了Blending和Stacking两种融合方式的原理、实现过程及其优缺点。通过具体实例展示了如何使用StackingCVClassifier和StackingCVRegressor进行模型融合,旨在帮助读者理解模型融合的机制并掌握其实践方法。

前言

机器学习中很多训练模型通过融合方式都有可能使得准确率等评估指标有所提高,这一块有很多问题想学习,于是写篇博客来介绍,主要想解决:

  • 什么是融合?
  • 几种方式融合
  • 基本的模型融合组合及适用场景、优缺点等

什么是融合?

构建并结合多个学习器来完成学习任务,我们把它称为模型融合或者集成学习。不同的模型有各自的长处,具有差异性,而模型融合可以使得发挥出各个模型的优势,让这些相对较弱的模型(学习器)通过某种策略结合起来,达到比较强的模型(学习器)。基本的融合方式有:

  • Blending
  • Stacking

选择融合模型的模型有两点要求:

  • 准确性
    要求该模型的性能不能太差
  • 差异性
    选择模型一般是多个,要求这多个模型之间有差异,有差异才能通过融合模型发挥他们的优势。

Blending融合方式

主要思想是多个学习器投票、加权等方式来获得一个新的预测值,在分类问题中就是多数投票,回归问题就是加权,对学习器结果进行加权求和,权重值和为1。那么一些基本的融合方式就是:

Uniform Blending (均匀融合)

少数服从多数思想,投票模型,直接可以根据多个模型结果做判断。
G ( x ) = s i g n ( ∑ t = 1 T 1 ∗ g t ( x ) ) G(x) = sign(\sum^{T}_{t=1}1*g_t(x)) \\ G(x)=sign(t=1T1gt(x))
在这里给每个学习器的权重都是1,每一个权重都是一样的,通过投票的方式来确定选择哪个。

Linear Blending (线性融合)

G ( x ) = s i g n ( ∑ t = 1 T a t g t ( x ) ) a t ≥ 0 G(x) = sign(\sum^{T}_{t=1}a_tg_t(x)) \\ a_t \ge 0 G(x)=sign(t=1Tat

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值