目录
一、Title
RTFNet: RGB-Thermal Fusion Network for Semantic Segmentation of Urban Scenes
二、Journal
IEEE ROBOTICS AND AUTOMATION LETTERS
三、Background
相比RGB相机,热成像相机的优势。
四、Model

RTFNet是用于城市场景语义分割的深度神经网络模型,RTFNet的总体架构见上图。RTFNet由三个模块组成:RGB编码器和热编码器,分别用于从RGB图像和热图像中提取特征;解码器,用于恢复feature map的分辨率。RTFNet中的解码器模块不是编码器模

本文介绍了一种名为RTFNet的深度学习模型,该模型用于城市场景的语义分割。RTFNet结合了RGB和热成像数据,通过非对称的编码器-解码器结构进行特征融合和恢复。模型包含两个大型编码器和一个小型解码器,其中Upception blocks在解码过程中逐步恢复分辨率并减少特征通道。实验部分展示了模型在不同场景下的效果。

5639

被折叠的 条评论
为什么被折叠?



