创新点
1.Hybrid Task Cascade(HTC)
总结
基于maskrcnn和cascade rcnn的改进。
论文中提出的几种cascade结构:
a,b结构就不细说了。分析一下c和d。
c较ab多出了一个结构,就是mask的cascade的特征图的流动。
算法结构如下:
上一个阶段的mask经过1X1 的卷积校准,与特征图做点加,然后经过4个卷积得到当前阶段的mask。
d在此基础上增加了空间语义信息。
语义信息的使用遵循以下公式:

最后
商汤的文章
复杂!
挺有想法的,但是示例图画得一般,不太好理解。比如结构C中的级联结构算法中有一层deconv,文中好像并没有说是什么作用,而且还是胡同,没有接下去的线。还有空间信息的融合这一块,语义特征图和语义预测两个分支,迷迷糊糊的,使用方法也讲得很不清楚。。。。
本文深入探讨了HybridTaskCascade(HTC)算法,一种基于Mask R-CNN和Cascade R-CNN的创新改进。HTC引入了mask级联结构,通过特征图流动优化目标检测与分割任务。特别关注了C和D结构,分析了空间语义信息的融合方法,尽管论文中的示例图可能不够清晰,但展示了算法在复杂场景下的潜力。

473

被折叠的 条评论
为什么被折叠?



