从GAN到CONAN:多视图聚类中的融合策略进化史与对比学习的崛起
当COIL-100数据集中同一物体的20个不同视角图像同时呈现在算法面前时,传统多视图聚类方法往往陷入"视角差异困境"——如何平衡不同视角间的共性与特性?这个看似简单的技术命题,在过去五年引发了从生成对抗到对比学习的范式转移。我们正见证着多视图聚类领域一场静悄悄的革命:信息瓶颈理论指导下的融合策略迭代,正在重塑无监督学习的疆界。
1. 多视图聚类的核心挑战与早期方案
2018年发表在NeurIPS上的DAMC框架首次将生成对抗网络(GAN)引入多视图聚类领域时,研究者们相信找到了解决视角差异的银弹。该方案通过对抗训练约束不同视角的编码器,试图在保留视角特性的同时提取共享表示。但实践很快暴露出根本性矛盾:
# 典型GAN融合结构的伪代码实现
def DAMC_loss(views):
# 视角特定编码器
h1 = encoder1(view1)
h2 = encoder2(view2)
# 判别器试图区分不同视角的特征
adversarial_loss = discriminator(h1, h2)
# 生成器试图欺骗判别器
alignment_loss = -adversarial_loss
# 聚类损失
cluster_loss = kmeans(h1.concat(h2))
return alignment_loss + cluster_loss
这种架构在COIL-100数据集上暴露出三个致命缺陷:
- 像素级对齐陷阱:GAN的对抗训练迫使网络关注像素级特征,而聚类需要语义级抽象
- 优化目标冲突:判别器的目标函数与聚类目标存在根本性矛盾
- 视角特性侵蚀:强硬对齐会导致独特视角信息的丢失
2019


331

被折叠的 条评论
为什么被折叠?



