论文:Spider:A Unified Framework for Context-dependent Concept Segmentation
link:https://arxiv.org/pdf/2405.01002
code:https://github.com/Xiaoqi-Zhao-DLUT/Spider-UniCDSeg
研究动机
图像分割关注的感兴趣目标种类繁多,如室内(人、桌椅);室外(车辆、道路);视觉注意力启发的显著性目标、伪装目标分割;医学领域的病灶分割等。在过去很长一段时间内,图像分割领域其实是缺乏对这些概念的一个总结和区分的。

然而,在认知科学领域[1],对于目标的概念一直有着明确的定义:上下文独立(CI)和上下文依赖(CD)概念。
CI概念无论处于何种场景,其对象定义都是明确的。可以看到,仅依靠前景,人们就可以捕获视觉目标是何种概念:熊,天鹅,船,车。其也是传统的语义分割任务所研究的概念类别。
而对于CD概念而言,仅依靠前景,无法明确当前表达的是何种概念,必须依靠周围环境的背景信息,才有可能明确当前的概念定义,例如显著性目标、伪装目标、阴影、医学病灶等。(为什么说有可能呢?因为CD概念的单张图像可能存在歧义,需要多组图像才能统一为一种概念指示)
因此,上下文信息 (背景+前景)对于CI概念的理解是辅助层面,而对CD概念是决定性层面。


1718

被折叠的 条评论
为什么被折叠?



