LaserNet:一种用于自动驾驶的高效概率三维物体探测器
下图2是论文中提出算法的主要框架

一、论文的综述
我们使用传感器固有的范围视图表示来构建密集的输入图像(第3.1节)。图像通过完全卷积网络以产生一组预测(第3.2节)。对于图像中的每个LiDAR点,我们预测一个类概率,并在自上而下的视图中对边界框上的概率分布进行回归(第3.3节)。这些每点分布通过均值偏移聚类相结合,以减少各个预测中的噪声(第3.4节)。整个探测器端到端地进行训练,并在箱角上定义损耗(第3.5节)。在推论中,我们利用一种新颖的自适应非最大抑制(NMS)算法来消除重复的盒子分布(第3.6节)。
二、个人的一些理解
首先,网络的输入是LiDAR的原始数据——密度图,论文中包括5个通道图像:范围r,高度z,方位角θ,强度e,以及指示单元是否包含点的标记。然后通过CNN,进行特征的提取和聚合。之后对于每个点,预测一组类概率(就是这个点属于哪一类的概率),对于每个点和对象类(为啥是每个点和对象类呢,猜测是后面为了减少噪声,就行了一个聚类的过程,就是把很多个点聚合在一起,共同进行参数预测),网络预测一组边界框参数,一组对数标准差和一组混合权重(边框的分布预测是多模态的,混合权重是为了找到其中对预测有最大贡献的组成部分,然后在之后的网络优化过程中重点关注)。
我认为,这篇论文的新颖之处在于——“我们提出的方法是首先通过对边界框角的分布进行建模来捕获检测的不确定性。”大概就是——“我们估计了盒子检测的概率分布而不仅仅是均值,而预测分布的方差

LaserNet是一种针对自动驾驶的高效3D物体检测算法,它利用LiDAR点云数据,通过全卷积网络预测每个点的类概率和边界框概率分布。通过聚类和自适应NMS减少噪声,模型端到端训练,损失函数关注边框分布的不确定性。论文在较大的数据集上表现出更好的性能,强调预测边界框分布的不确定性对其他检测方法也可能有益。

1231

被折叠的 条评论
为什么被折叠?



