"NetVLAD"场景识别模型解读

NetVLAD是一种基于卷积神经网络的场景识别算法,它改进了VLAD算法,通过软分配和端到端训练提高了检索能力。论文提出了NetVLAD网络层和弱监督Triplet损失,有效利用噪音数据。

c论文: NetVLAD: CNN architecture for weakly supervised place recognition

来源:CVPR 2016

应用:NetVLAD是一种场景识别算法,但实际上其不仅仅能应用于场景识别,该网络结构可以对卷积神经网络得到的中间特征进行编码,并实现了BP,因此可以用于其他任何以卷积神经网络为基础的识别或者检索场景,并获得比SIFT等为基础的其他特征编码算法更强的检索能力。

导读:NetVLAD是于2016年提出的一种场景识别算法,该算法改进于VLAD,VLAD算法以SIFT或该类算法为基础,对其提取的特征进行编码,得到一段较短的特征串,NetVLAD以卷积神经网络作为基础特征提取结构,与该网络连接,实现端到端的训练。该论文主要有两点贡献:1是设计了NetVLAD网络层,实现了其BP功能,从而可以做到端到端的训练,2是提出了一种弱监督的Triplet loss,从而可以有效的利用带有较多噪音的训练数据。

NetVLAD网络

首先给出整个网络的结果,如下图所示,其包含两个部分,首部分截取自一个卷积神经网络最后一个卷积层前,其输出为H*W*D(H,W为图像高宽,D为特征维度)的特征矩阵,尾部分实际上可以理解其为池化层,该层的设计基于VLAD,因此其命名为NetVLAD层。

VLAD在BOF、FV、VLAD算法浅析 这里有过简单阐述,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值