订正,本章内容仍使用keras框架进行分析,主要参考《Python深度学习(keras)》(Deep Learning with Python)。
关于深度学习和计算机视觉相结合的卷积操作,在很多博文中都有所介绍,对于其具体的操作方法也不仅相同,本文只介绍作者自己的看法
单通道卷积
在卷积操作中,单通道卷积是基础,理解单通道卷积后,我们再去讨论后续内容。
常见的图像一般为RGB颜色空间,为了方便处理,通常的处理方式是分为R(红色)G(绿色)与B(蓝色)3个通道。在下图中,以RGB3通道的其中一个通道为例,在单通道卷积中,卷积核以滑动的形式遍历整张图像,当然,卷积可以有多个卷积核,每一个卷积核对应一个feature map(卷积之后的特征图)

多通道卷积
多通道卷积可分为常规卷积与深度可分离卷积,两者的区别在于参数数量,我们知道在深度卷积网络训练的过程中过多的参数会增大网络计算量,不利于网络模型泛化等缺点。深度可分离卷积在实现常规卷积的基础上减少了网络参数。
常规卷积
常规的多通道卷积和单通道卷积类似,区别在于在多通道卷积中,用于卷积图像的卷积和同样也是多通道的,以RGB图像为例,那么生成的卷积核同样是3个通道,具体步骤如下:
(1)在各自通道上进行单通道卷积;
(2)将各通道汇聚(通道相加)
这里要区分卷积核数目和通道数目以及最后输出的feature map的通道数量,在很多框架中,通常只需要指定卷积和的宽和高(例如3*3)和输出的feature map的通道数目,而不会去指定卷积核通道数目,如

本文深入探讨了卷积神经网络中的卷积操作,从单通道卷积的基础概念出发,解释了如何进行多通道卷积,包括常规卷积和深度可分离卷积。重点讨论了多通道卷积的工作原理,强调了参数数量对网络计算量和模型泛化能力的影响。此外,还预告了深度可分离卷积的后续讨论。

5128

被折叠的 条评论
为什么被折叠?



