"NetVLAD"场景识别模型解读

最新推荐文章于 2026-03-30 06:54:32 发布

原创

最新推荐文章于 2026-03-30 06:54:32 发布 · 6.8k 阅读

·

3

·

NetVLAD是一种基于卷积神经网络的场景识别算法，它改进了VLAD算法，通过软分配和端到端训练提高了检索能力。论文提出了NetVLAD网络层和弱监督Triplet损失，有效利用噪音数据。

c论文： NetVLAD: CNN architecture for weakly supervised place recognition

来源：CVPR 2016

应用：NetVLAD是一种场景识别算法，但实际上其不仅仅能应用于场景识别，该网络结构可以对卷积神经网络得到的中间特征进行编码，并实现了BP，因此可以用于其他任何以卷积神经网络为基础的识别或者检索场景，并获得比SIFT等为基础的其他特征编码算法更强的检索能力。

导读：NetVLAD是于2016年提出的一种场景识别算法，该算法改进于VLAD，VLAD算法以SIFT或该类算法为基础，对其提取的特征进行编码，得到一段较短的特征串，NetVLAD以卷积神经网络作为基础特征提取结构，与该网络连接，实现端到端的训练。该论文主要有两点贡献：1是设计了NetVLAD网络层，实现了其BP功能，从而可以做到端到端的训练，2是提出了一种弱监督的Triplet loss，从而可以有效的利用带有较多噪音的训练数据。

NetVLAD网络

首先给出整个网络的结果，如下图所示，其包含两个部分，首部分截取自一个卷积神经网络最后一个卷积层前，其输出为H*W*D（H，W为图像高宽，D为特征维度）的特征矩阵，尾部分实际上可以理解其为池化层，该层的设计基于VLAD，因此其命名为NetVLAD层。

VLAD在BOF、FV、VLAD算法浅析这里有过简单阐述，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。