实时分割网络-LinkNet
LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation
普渡大学
CVPR 2017
一 论文摘要
- 背景介绍:用于场景理解的像素级语义分割不仅需要准确度,还要保证高效性,才能应用在实时应用程序中
- 现有算法:现有算法虽然比较准确,但参数和计算量都比较庞大,因此速度很慢
- 本文算法:本文提出了一种新的DCNN网络,该体系结构使其无需增加大量参数即可进行学习
- 模型评估:在CamVid和Cityscapes数据集中均得到不错的成绩
二 相关工作 & 引言
- 分割任务需要对每个像素进行标记,因此,空间信息的保留就比较重要,用于场景理解的分割网络一般都是以编码器-解码器作为主要网络结构
- 端到端的分割网络大多数使用imageNet上的分类模型作为编码器部分,使用最大池化操作保留的索引或者反卷积等方式作为解码器部分
- 本文主要贡献是直接将编码器与解码器对应部分连接起来,从而直接提高准确率,一定程度上减少了处理时间,通过这种方式,可以保留编码部分中不同层丢失的信息,在进行重新学习丢失的信息时并未增加额外的参数和操作。
三 LinkNet 算法架构
每个编码器(基于ResNet18)与解码器相连接,编码器的输出连接到对应的解码器的输入,可更好的提升效率和精度

LinkNet是一种针对实时语义分割设计的深度学习网络,它利用ResNet18作为基础的编码器,并将编码器的输出直接连接到解码器,以保留空间信息并减少计算成本。这种方法在不显著增加参数量的情况下提高了准确性,适用于需要高效像素级语义分割的场景,如CamVid和Cityscapes数据集。

4855

被折叠的 条评论
为什么被折叠?



