DenseBox (2015) (https://arxiv.org/abs/1509.04874)
densebox最早提出来是用来检测人脸的, 其有两个主要贡献, 第一是提出使用一个完整的FCN来预测box而不需要预先的proposal, 而且是end2end的训练过程; 第二是提出了用目标上已有的关键点信息来辅助box的定位.

为了节省训练时间, densebox没有直接把一整张图片都丢进去训练, 而是在目标周围裁剪出240240大小的patch丢进去训练, 最后输出6060*5的输出, 每个featuremap上的位置产生一个5d vector, 代表 (score, d x t d_{xt} dxt, d y t d_{yt} dyt, d x b d_{xb} dxb, d y b d_{yb} dyb), score就是该点的confidence, 0~1之间; ( d x t d_{xt} dxt, d y t d_{yt}

本文回顾了无锚点目标检测方法的发展,包括DenseBox、CornerNet、CenterNet等。这些方法摒弃了传统的锚框,直接预测目标的角点或中心点。CornerNet利用角点定位目标,而CenterNet则引入中心点信息以提高准确性。文章还探讨了如FCOS等其他无锚点方法,并分析了它们的优缺点,强调了速度与精度的平衡,其中Objects as Points因其简洁高效而受到关注。

2206

被折叠的 条评论
为什么被折叠?



