论文:CVPR2017,源码开放
概述:DAN-Deep Alignment Network,发表于CVPR-2017。以往级联神经网络输入的是图像的某一部分,与以往不同,DAN各阶段网络的输入均为整张图片。当网络均采用整张图片作为输入时,DAN可以有效的克服头部姿态以及初始化带来的问题,从而得到更好的检测效果。之所以DAN能将整张图片作为输入,是因为其加入了关键点热图(Landmark Heatmaps),关键点热图的使用是本文的主要创新点。(转载:https://blog.csdn.net/u013948010/article/details/80520540)
主要贡献:
1)引入了关键点热图,从而可以使用整张人脸提升实验效果,而避免了使用人脸局部图像块,导致的陷入局部极小值;
2)结果鲁棒性强;
3)开放了源码和网络结构;
以下根据论文摘出文中重点:
文中指出DAN(Deep Alignment Network)是受了Cascade Shape Regression(CSR)方法的启发:图像会得到一个脸部形状的初始化估计,通过若干次的迭代,从而得到最终的结果;而二者又是有区别的,区别在于:CSR使用关键点周围的图像块周围的特征,而DAN使用的是整脸特征;整体框架图如下:

DAN每个阶段都会有三个输入:输入图片(input image I),关键点热图(Ht),和特征图(Ft):输入图片I会被当前的关键点估计旋转(warped),从而与正则形状(canonical shape)S0对齐,而特征图Ft是由先前t-1阶段的dense layer和pen


521

被折叠的 条评论
为什么被折叠?



