多视图学习:原理、应用与方法解析
1. 多视图学习的背景与定义
1.1 背景
在众多科学数据的分析任务中,数据通常是通过不同的测量方法收集而来的,比如各种特征提取器或传感器。这是因为单一的测量方法往往无法全面描述数据的所有信息。在这种情况下,每个数据实例的特征可以自然地划分为不同的组,每一组都可以看作一个视图。例如,对于图像和视频,颜色特征和纹理特征就可以被视为两个不同的视图。
多视图机器学习(简称多视图学习)是机器学习的一个分支,它主要研究和利用不同视图之间的信息和关系。早期多视图学习的两个代表性工作分别是典型相关分析(CCA)和协同训练(co - training)。特别是协同训练方法提出之后,多视图学习的研究开始兴起。2005 年在国际机器学习会议上举办的多视图学习研讨会,进一步推动了这一领域的研究。到目前为止,多视图学习在理论和实践方面都取得了很大的进展,其相关思想也被融入到机器学习的多个领域,并不断发展。一个精心设计的多视图学习策略可能会为这些领域的发展带来益处。
1.2 定义及相关概念
多视图学习是机器学习的一个重要分支。在学习过程中,多视图学习会明确使用数据的多个不同表示,并对它们之间的关系以及下游计算的结果进行建模。这里的“表示”既可以是数据的原始特征,也可以是通过某些计算得到的特征。一种简单利用这些表示的方法是将它们简单地连接成一个单一的表示来进行学习,但这种策略存在两个缺点:在相对较小的训练集上可能会出现过拟合问题,并且会忽略每个视图的特定统计属性。此外,多视图学习还可以有效提高自然单视图数据的学习性能。
一般来说,多视图学习方法主要分为三大类:协同训练风格算法、协同正则化风格算法和边界一致性
超级会员免费看
订阅专栏 解锁全文



3万+

被折叠的 条评论
为什么被折叠?



