【经典论文阅读】YOLO-V4论文阅读

本文详细探讨了YOLOv4目标检测模型的结构优化、数据增强、类不平衡处理、边界框目标函数及后处理方法。通过实验研究了不同特征、骨干网络、mini-batch大小对模型性能的影响，展示了如何通过Bag of Freebies和Bag of Specials提升精度和效率。

文章目录

1. 检测模型结构 Object detection models
2. Bag of freebies
3. Bag of specials
4. Methodology方法论
5. Details of YOLOv4🐱‍🏍
6. Experiments实验过程
总结：

论文地址

We use new features: WRC, CSP,CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss, and com-bine some of them to achieve state-of-the-art results: 43.5%AP (65.7% AP50) for the MS COCO dataset at a real-time speed of ∼65 FPS on Tesla V100.

1. 检测模型结构 Object detection models

在这里插入图片描述
对于运行在GPU平台上的检测器，其骨干可以是VGG、ResNet、ResNeXt或DenseNet。
对于那些运行在CPU平台上的检测器，其骨干可以是SqueezeNet、MobileNet或ShuffleNet。

对于Head部分，通常分为one stage（一级目标检测器）和tow stage（二级目标检测器）两种。tow stage： R-CNN系列，包括fast R-CNN、faster R-CNN、R-FCN和Libra R-CNN。也可以使两阶段对象检测器成为无锚对象检测器，如RepPoints。
one stage： 最具代表性的模型有YOLO、SSD和RetinaNet。

近年来，Anchor free（无锚单级目标检测器）得到了发展。这类探测器有CenterNet、cornnet、FCOS等。

近年来发展起来的目标检测器通常在 Backbone 和 Head 之间插入一些层，这些层通常用于收集不同阶段的特征图。我们可以称之为物体探测器的颈部 Neck。通常，一个颈由多条自底向上的路径和多条自顶向下的路径组成。具有该机制的网络包括：特征金字塔网络(FPN)、路径聚合网络(PAN)、BiFPN和NAS-FPN。

在这里插入图片描述