【论文阅读】【弱监督-3D目标检测】WS3D:Weakly Supervised 3D Object Detection from Lidar Point Cloud

本文介绍了一种弱监督的3D物体检测方法,只需少量BEV中心点标注和精确标注实例,就能达到全监督性能的85-95%。该方法包括两个阶段,先生成圆柱形提案,再细化为长方体。此外,训练出的模型还能作为自动标注工具,支持自动和主动标注模式,有效降低了标注成本和时间。实验表明,模型在Kitti数据集上的表现接近全监督,并能用于生成高质量的3D对象标注。

前言

《Weakly Supervised 3D Object Detection from Lidar Point Cloud》(WS3D)

ECCV20录用的一篇文章,后面扩展出一篇TPAMI,我在这里就合并两篇文章一起整理介绍了。

北京理工的一位在读博士。

论文地址:https://arxiv.org/abs/2007.11901

Code地址:https://github.com/hlesmqh/WS3D

TPAMI论文地址:https://ieeexplore.ieee.org/document/9369074/

解决的问题及对应贡献

  • 自主驾驶领域中弱监督三维物体检测的早期尝试
  • 一种允许使用低成本的标签进行三维目标检测的新的网络设计。
  • 一个容易使用的标注工具,其可以根据不同的需求选择不同的模式来标记点云。

核心思想:

弱监督的3D点云目标检测,训练数据是少量的弱标签(BEV目标中心点)+少量的kitti-groundtruth,效果能与全监督性能相近,甚至更好。基于此,还做了一个自动标注器。

文章解读

1.摘要:

人工标记训练高质量的点云数据是很费力的。这项工作提出了一种三维对象检测的弱监督方法,只需要一小组弱注释的场景,与一些精确标记的对象实例相关联。这是通过一个两阶段的架构设计来实现的。第一阶段学习在弱监督下生成圆柱形物体提案,仅在鸟视图场景中点击标注对象的水平中心,第二阶段学习完善圆柱形的建议,使用一些标记良好的实例以获得长方体和有信心的分数,仅使用500个弱注释的场景和534个精确标记的车辆实例。我们的方法达到了目前领先的完全监督的探测器(需要3712个详尽和精确注释的场景和15654个实例)85-95%的性能。此外,通过我们精心设计的网络架构,我们训练过的模型可以应用作三维对象标注器,支持自动和主动(人工循环)工作模式,由我们的模型生成的注释可以用于训练三维对象检测器,达到超过94%的原始效果(使用人工标记的培训数据)。我们的实验还表明,当提供更多的训练数据时,我们的模型在提高性能方面还有一定的潜力。以上设计使我们的方法非常实用,并在降低注释成本的情况下为学习三维对象检测引入了新的机会

2.Introduction:

两个阶段 ,第一个阶段需要一小部分的弱标注鸟视图数据,标注形式是在鸟视图中物体的水平中心位置标点(这样标注成本大大降低)。BEV中没有高度信息,所以产生一组y轴的范围是无限的圆柱形方案,同时需要一部分与弱标注对应精确标注的数据。如图1所示

第二阶段从这些建议方案中学习估计三维参数,并预测相应的置信度分数


图 1
其弱监督框架提供了两个吸引人的特性:
  1. 它利用少量弱标记的BEV数据和精确注释的对象实例来学习三维对象检测,标注成本和耗时都大大降低
  2. 一旦训练,生成的检测器可以作为一个注释工具应用,以帮助费力的标签过程。(成为一个自动化的标注工具)。实验证明,采用这个工具,重新自动化标注KITTI,重新训练PointPillar和PointRCNN可以达到原始性能的94%。如果采用活动模式,人工只是首先在BEV中标物体中心点,重新标注训练能达到原始性能的96%的效果。更关键的是,模型能够以更低的速度,以更少的监督提供更准确的注释

监督的方式:

当前在2D传感器中常用的方式是:中心点击、极点或者校正点。本文采用的方式是在BEV视图中采用中心点。


图 2

本文方法采用500个弱标注帧和对应的534个精确标注车辆实例,达到全监督(3712精确标注帧、15654个车)效果的85-95%。

可以看到本文方法以较低的标注数据量达到与全监督相近的效果

弱监管的数据注释策略:
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值