Background & Motivation
Viewpoint Estimation,视点估计。用点云数据在 3D 场景理解/重建、增强现实以及机器人领域中,主要关注 Object Detection。

不论是目标检测还是视点估计,小样本的方法是非常有应用前景但是 under-explored。传统的方法都需要大量的带标注数据,在 Novel 类上泛化能力很差。
本文的方法基于 Faster Rcnn,将 query 和 support 的 RoI 输入一个特征聚合模块,之后再输入到分类头中。
Approach
Network Architecture

基于 Faster Rcnn,support(下面的分支称为 support)中包含 mask 标注。Fqry 和 Fcls 为 Backbone、RPN 和 RoI Align/Pooling,除了第一层之外共享权重。A 是一个 feature aggregation module,将 Fqry 和 Fcls 的特征聚合起来。最后送入 P 做分类和目标框的回归:


1773

被折叠的 条评论
为什么被折叠?



