参考:https://www.jianshu.com/p/7d48bff4d1c3
NeXtVLAD 是一个特征聚合的网络,可以在 向量空间中 提取 全局描述子特征,减少参数,提升性能。 在处理 视频音频特征聚合 时,效果甚好。
一、VLAD(局部聚类向量—提取图像特征)

这里提到的VLAD算是特征提取函数 f 的一种,可简称为 fvlad 。
VLAD的全称是Vector of Locally Aggregated Descriptors,即“局部聚集描述子向量”。顾名思义,把聚集起来的局部描述子构造成一个向量,用该向量作为图像的全局描述子。
图像局部特征可以用
超级会员免费看
这篇博客介绍了VLAD、NetVLAD和NeXtVLAD三种特征聚合方法在图像和视频处理中的应用。VLAD通过局部聚类向量提取图像特征,NetVLAD利用神经网络实现可导的特征聚合,而NeXtVLAD通过借鉴ResNeXt的思想,降低参数量的同时保持性能。这些方法在减少特征维度、提升模型表现方面有所贡献。

订阅专栏 解锁全文

3万+

被折叠的 条评论
为什么被折叠?



