视频链接:https://www.bilibili.com/video/BV1J3411C7zd?vd_source=a0d4f7000e77468aec70dc618794d26f
代码:https://github.com/WZMIAOMIAO/deep-learning-for-image-processing
FCN是2015年提出的首个端对端的针对像素级预测的全卷积网络。
如今的pytorch实现的FCN都是基于ResNet-50的backbone,不是论文中的VGG16,且使用的是空洞卷积(也叫膨胀卷积)
pytorch官方实现的FCN网络结构图
一、相比以前网络的巨大提升:

二、传统使用池化层最后得到的其实是一个长度为1000的向量:

而换为卷积层之后,最后得到的是1000通道的2D图像,可以可视化为heat map图。
三、回顾VGG16
一般说的vgg16是D:

全连接操作前后:77512(通道)

【 假 设 忽 略 偏 置 】 \color{red}{【假设忽略偏置】} 【假设忽略偏置】
全连接FC1计算:计算对应某一个结点的输出,将该节点与上一层某一个结点的权重与输入对应节点数值相乘,再求和
FC1参数:25088*4096=102760448
下层使用7*7的卷积核、stride=1,4096个卷积核的一个卷积层
Conv参数:77512*4096=102760448
一 个 卷 积 核 和 F C 1 一 个 节 点 参 数 量 一 样 \color{red}{一个卷积核和FC1一个节点参数量一样} 一个卷积核和FC1一个节点参

该博客介绍了FCN(全卷积网络)在语义分割中的作用,强调了它相对于传统网络的提升,如将全连接层替换为卷积层以得到像素级预测。FCN-32s、16s、8s的区别在于上采样率,FCN-32s最简单,不融合底层信息,而16s和8s则融合了更深层次的信息。代码示例使用了ResNet-50作为backbone,并详细说明了其结构变化,包括卷积层和转置卷积层的使用。损失计算采用像素级的交叉熵损失,并讨论了评估指标和实现细节。

&spm=1001.2101.3001.5002&articleId=125286033&d=1&t=3&u=df0a96a7121a469eb471c9cbf8d9aa67)
2616

被折叠的 条评论
为什么被折叠?



