21年的一篇CVPR
论文link:link
code:link
摘要
伪装目标检测是一项具有挑战性的任务,因为目标与周围环境之间的边界对比度很低。此外,伪装物体的外观变化很大,例如物体的大小和形状,这增加了准确的COD的难度。本文提出了一种新的上下文感知跨级融合网络(C2F-Net)来解决具有挑战性的协同设计任务。具体地说,我们提出了一种注意力诱导的跨层融合模块(ACFM)来整合具有信息的注意系数的多层特征。然后,融合后的特征被馈送到所提出的双分支全局上下文模块(DGCM),该模块产生用于利用丰富的全局上下文信息的多尺度特征表示。在C2F-Net中,这两个模块以级联方式在高层特征上进行。在三个广泛使用的基准数据集上的大量实验表明,我们的C2F-Net是一个有效的COD模型,其性能明显优于最新的模型。
1.主要贡献
1.提出一个新的COD模型:C2F-Net,结合了跨层特征和丰富的全局上下文信息
2.提出了一种上下文感知模块DGCM,利用融合后的特征中的全局上下文信息,DGCM能够捕获有价值的上下文信息,这是提高COD准确率的关键因素
3.我们将跨层特征与一个有效的融合模块ACFM结合,该模块将这些特征与MSCA提供的有价值的注意线索相结合。
4.在三个基准数据集上的大量实验表明,我们的C2F-Net在四个评价指标方面优于14个最先进的模型
2.模型结构图

3.方法
C2FNet总体架构,该架构融合了上下文感知的跨层特征来提高伪装目标检测的性能,具体来说就是采用Resnet50在五个不同层次的层提取特征,表示为: f i ( i = 1 , 2 , . . . 5 ) f_i(i=1,2,...5) fi(i=1,2,...5),然后,采用RFB模块来扩展感受域,以捕捉特定层中的更丰富的特征,RFB组件包括五个分支,在每个分支中,第一卷积层具有 1 × 1 1 \times 1 1×1的维度将信道大小减少到64,然后是两层,即(2k−1)×(2k−1)卷积层和当k>2时具有特定扩张率(2k−1)的3×3卷积层。将前四个支路级联,然后使用1×1卷积运算将它们的信道尺寸减小到64。然后,添加第五个分支,并将整个模块馈送到RELU激活函数,以获得最终的特征。在此基础上,提出了一种融合多尺度特征的注意力诱导跨层融合模块(ACFM)和一种挖掘融合特征中多尺度上下文信息的双分支全局上下文模块(DGCM)。最后给出了伪装目标检测的预测结果。
3.1 ACFM:Attention-indiced Cross-level Fusion Module
具有较大空间分辨率的低层特征比高层特征需要更多的计算资源,但对深度集成模型的性能贡献较小,出于这一观察,只在高层次特征中进行ACFM,将 f i ( i = 3 , 4 , 5 ) f_i(i=3,4,5) fi(i=3,4,5)成为高层特征,其跨层融合过程如下:
F a b = M ( F a ∪ F b ) ⊗ F a ⊕ ( 1 − M ( F a ∪ F b ) ) ⊗ F b {F_{
{\rm{ab}}}} = M({F_a} \cup {F_b}) \otimes {F_a} \oplus (1 - M({F_a} \cup {F_b})) \otimes {F_b} Fab=M(Fa∪Fb)⊗Fa⊕

本文介绍了一种新的伪装目标检测模型C2F-Net,通过ACFM融合跨层特征和DGCM捕捉全局上下文信息,实现在多个基准数据集上的显著性能提升。方法包括注意力诱导的ACFM和双分支全局上下文模块,以及针对不同尺寸输入的处理策略。

5346

被折叠的 条评论
为什么被折叠?



