论文笔记（一）【 Disentangled Representation Learning GAN for Pose-Invariant Face Recognition】

最新推荐文章于 2026-05-07 06:17:55 发布

原创

最新推荐文章于 2026-05-07 06:17:55 发布 · 1.2w 阅读

·

1

·

标签

#DR-GAN #论文笔记

本文为DR-GAN论文笔记，探讨了如何通过encoder-decoder框架学习姿态不变的人脸识别表示。DR-GAN能根据姿态代码生成特定角度人脸，其目标函数和网络结构设计有助于学习区分度高的身份信息。此外，Multi-Image DR-GAN引入了自信系数以融合多张图片的表示。实验在Multi-Pie数据集上进行，强调了数据处理和网络结构的重要性。

论文地址：论文

大体分为两部分，第一部分是自己读文章时的记录，第二部分是自己总的感想。

一、论文概述：

1、在摘要中提出了DR-GAN的名字，给出了论文的三个创新点。

（1）通过generator 的encoder-decoder框架学习了生成和判别的表示（representation）；

（2）这种表示是从姿态这种人脸变量得出。姿态（pose）代码传输到decoder，姿态的估计（estimation）传给了判别器；

（3）DR-GAN可以输入一张或者多张照片，并且根据随机的合成图片生成统一的表示。

2、根据figure1，在discriminator和generator都可以生成身份标识，可以根据姿态代码生成特定身份的人脸。

endoder输入的是任意角度的人脸，decoder合成目标角度的人脸。G起到了人脸旋转的作用。D不仅比较真实图片和合成图片，而且输出身份和角度。因此，G需要做到：（1）旋转的图片跟输入的图片的身份一样；（2）学到的表示应该更具有多样性。

3、在CGAN中，G输入一个随机的噪音来合成图片。在DR-GAN中，G的输入包括人脸图片，姿态条件和噪音。目的是生成相同身份特定角度的人脸（a face of the same identity with the target pose）。在G-encoder中，输入多张不同角度的图片，生成单一身份的表示；在G-decoder中合成具体角度的人脸。

4、在3.2节中，文章给出

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。