2019年CVPR上的文章
论文原文地址:https://arxiv.org/abs/1901.01660?context=cs
跟踪部分的代码也放出来了:https://gitlab.com/MSRA_NLPR/deeper_wider_siamese_trackers/tree/master/
提出问题:
基于孪生网络的跟踪大部分的主干网络都是AlexNet,这个网络已经很久了,为什么不充分利用现在深度网络的优势呢。作者发现,如果直接将主干网络换成ResNet,Inception等网络,效果是不好的,而且随着深度的增加,效果更加不好。看下图蓝线(其中红线是作者提出的网络,暂且不说):

这篇文章的工作:
分为两部分:
- 作者通过系统的实验发现了主干网络影响孪生网络的三个重要因素,也就是最后一层感受野大小、网络总步长和特征的padding的有无,并且提出了一个孪生网络结构的设计指南。
- 在这个指南的帮助下,作者提出了一个新的网络结构,它能深能宽,替换了SiamFC和SiamRPN的主干网络,使之性能较之原来的跟踪器得到提升,并取得了State-of-the-Art
1. 性能降低分析 Analysis of Performance Degradation
这一部

本文探讨了基于孪生网络的视觉追踪技术,分析了深度网络在该领域的应用挑战,并提出了一种新的网络结构——CIR单元,有效提升了追踪精度。通过系统实验,作者揭示了影响追踪效果的关键因素,包括感受野大小、网络步长和padding使用,为设计高性能追踪器提供了指导。
1533

被折叠的 条评论
为什么被折叠?



