从GAN到CONAN:多视图聚类中的融合策略进化史,为什么对比学习成为新宠?

从GAN到CONAN:多视图聚类中的融合策略进化史与对比学习的崛起

当COIL-100数据集中同一物体的20个不同视角图像同时呈现在算法面前时,传统多视图聚类方法往往陷入"视角差异困境"——如何平衡不同视角间的共性与特性?这个看似简单的技术命题,在过去五年引发了从生成对抗到对比学习的范式转移。我们正见证着多视图聚类领域一场静悄悄的革命:信息瓶颈理论指导下的融合策略迭代,正在重塑无监督学习的疆界。

1. 多视图聚类的核心挑战与早期方案

2018年发表在NeurIPS上的DAMC框架首次将生成对抗网络(GAN)引入多视图聚类领域时,研究者们相信找到了解决视角差异的银弹。该方案通过对抗训练约束不同视角的编码器,试图在保留视角特性的同时提取共享表示。但实践很快暴露出根本性矛盾:

# 典型GAN融合结构的伪代码实现
def DAMC_loss(views):
    # 视角特定编码器
    h1 = encoder1(view1)  
    h2 = encoder2(view2)
    
    # 判别器试图区分不同视角的特征
    adversarial_loss = discriminator(h1, h2)  
    
    # 生成器试图欺骗判别器
    alignment_loss = -adversarial_loss  
    
    # 聚类损失
    cluster_loss = kmeans(h1.concat(h2))  
    
    return alignment_loss + cluster_loss

这种架构在COIL-100数据集上暴露出三个致命缺陷:

  1. 像素级对齐陷阱:GAN的对抗训练迫使网络关注像素级特征,而聚类需要语义级抽象
  2. 优化目标冲突:判别器的目标函数与聚类目标存在根本性矛盾
  3. 视角特性侵蚀:强硬对齐会导致独特视角信息的丢失

2019

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值