伪装目标检测系列论文阅读之：C2FNet《Context-aware Cross-level Fusion Network for Camouflaged Object Detection》

原创

已于 2024-04-28 19:15:12 修改 · 2.6k 阅读

标签

#目标检测 #论文阅读 #人工智能

于 2024-04-23 20:18:47 首次发布

本文介绍了一种新的伪装目标检测模型C2F-Net，通过ACFM融合跨层特征和DGCM捕捉全局上下文信息，实现在多个基准数据集上的显著性能提升。方法包括注意力诱导的ACFM和双分支全局上下文模块，以及针对不同尺寸输入的处理策略。

21年的一篇CVPR
论文link：link
code：link

摘要

伪装目标检测是一项具有挑战性的任务，因为目标与周围环境之间的边界对比度很低。此外，伪装物体的外观变化很大，例如物体的大小和形状，这增加了准确的COD的难度。本文提出了一种新的上下文感知跨级融合网络(C2F-Net)来解决具有挑战性的协同设计任务。具体地说，我们提出了一种注意力诱导的跨层融合模块(ACFM)来整合具有信息的注意系数的多层特征。然后，融合后的特征被馈送到所提出的双分支全局上下文模块(DGCM)，该模块产生用于利用丰富的全局上下文信息的多尺度特征表示。在C2F-Net中，这两个模块以级联方式在高层特征上进行。在三个广泛使用的基准数据集上的大量实验表明，我们的C2F-Net是一个有效的COD模型，其性能明显优于最新的模型。

1.主要贡献

1.提出一个新的COD模型：C2F-Net，结合了跨层特征和丰富的全局上下文信息
2.提出了一种上下文感知模块DGCM，利用融合后的特征中的全局上下文信息，DGCM能够捕获有价值的上下文信息，这是提高COD准确率的关键因素
3.我们将跨层特征与一个有效的融合模块ACFM结合，该模块将这些特征与MSCA提供的有价值的注意线索相结合。
4.在三个基准数据集上的大量实验表明，我们的C2F-Net在四个评价指标方面优于14个最先进的模型

2.模型结构图

在这里插入图片描述

3.方法

C2FNet总体架构，该架构融合了上下文感知的跨层特征来提高伪装目标检测的性能，具体来说就是采用Resnet50在五个不同层次的层提取特征，表示为： $f_i(i=1,2,...5)$ ，然后，采用RFB模块来扩展感受域，以捕捉特定层中的更丰富的特征，RFB组件包括五个分支，在每个分支中，第一卷积层具有 $\times 1$ 的维度将信道大小减少到64，然后是两层，即(2k−1)×(2k−1)卷积层和当k>2时具有特定扩张率(2k−1)的3×3卷积层。将前四个支路级联，然后使用1×1卷积运算将它们的信道尺寸减小到64。然后，添加第五个分支，并将整个模块馈送到RELU激活函数，以获得最终的特征。在此基础上，提出了一种融合多尺度特征的注意力诱导跨层融合模块(ACFM)和一种挖掘融合特征中多尺度上下文信息的双分支全局上下文模块(DGCM)。最后给出了伪装目标检测的预测结果。

3.1 ACFM：Attention-indiced Cross-level Fusion Module

具有较大空间分辨率的低层特征比高层特征需要更多的计算资源，但对深度集成模型的性能贡献较小，出于这一观察，只在高层次特征中进行ACFM，将 $f_i(i=3,4,5)$ 成为高层特征，其跨层融合过程如下：
${F_{ {\rm{ab}}}} = M({F_a} \cup {F_b}) \otimes {F_a} \oplus (1 - M({F_a} \cup {F_b})) \otimes {F_b}$

最低0.47元/天解锁文章