Shared Generative Latent Representation Learning for Multi-View Clustering
摘要
多视图数据聚类一直是计算机视觉领域的一个基础性研究课题。结果表明,综合所有视图的信息比单独使用一个视图可以获得更好的精度。然而,现有的方法往往存在处理大规模数据集和重构样本性能差的问题。本文提出了一种新的多视图聚类方法,该方法通过学习服从混合高斯分布的共享生成潜在表示来实现。动机是基于这样一个事实,即尽管不同视图之间存在差异,但多视图数据共享一个共同的潜在嵌入。具体而言,得益于深度生成学习的成功,该模型不仅可以从视图中提取非线性特征,而且具有捕获所有视图之间相关性的强大能力。在多个不同尺度的数据集上进行的大量实验结果表明,该方法在一系列性能标准下优于最先进的方法。
针对分类和信息检索,Srivastava等人(Srivastava and Salakhutdinov 2014)提出了一种用于学习多视图数据生成模型的深度Boltzmann机器。直到最近,还没有成功的多视图集群扩展。主要的障碍是如何以无监督的方式有效地利用视图间的共享生成潜在表示。为了解决这个问题,在本文中,我们提出了一种新的多视图聚类方法,即通过变分自编码器(DMVCVAE)学习服从混合高斯分布的共享生成潜在表示。特别是,我们的动机是基于这样一个事实,即尽管视图之间存在差异,但多视图数据共享一个共同的潜在嵌入。同时,该模型得益于深度生成学习的成功,可以通过神经网络捕获数据分布。贡献如下。
•我们提出了一种用于多视图聚类的共享生成潜在表示。具体来说,生成方法假设不同视图的数据共享给定观测数据的隐藏变量的共同条件分布,并且隐藏数据从高斯分布的混合中独立采样。
•为了更好地从多个角度挖掘信息,我们引入了一组非负组合权值,这些权值将在统一的框架中与深度自编码器网络共同学习。
•我们进行了大量的数值实验,表明所提出的方法在几个著名的数据集(包括大规模多视图数据)上优于最先进的聚类模型。
方法
1.体系结构:
给定一个多视图数据集{
∈
} (v = 1,2,...,m) ,共m个视图,则可以合理地假设第v个视图的第i个样本
是由某个未知过程生成的,例如,由一个未观测到的连续变量


3万+

被折叠的 条评论
为什么被折叠?



