假设我们要进行一次卷积操作,输入feature maps的channel为64,输出feature maps的channel也要为64,那么对于555×\times×555和333×\times×333的卷积尺寸该怎么选择呢(步长为1)?答案如下图所示:

即选择333×\times×333的卷积核对输入的feature maps做两次卷积而非用555×\times×555的卷积核对输入的feature maps做一次卷积。这样做的主要区别在于两点:1.参数量;2.感受野。
| kernel size | receptive field | params |
|---|---|---|
| 333×\times×333 | 555×\times×555 | 222×\times×333×\times×333×\times×646464×\times×646464 |
| 555×\times×555 | 555×\times×555 | 555×\times×555×\times×646464×\times×646464 |
通过上述表格我们可以发现,卷积核为3的两次卷积得到的feature maps的感受野与卷积核为5的一次卷积相等,并且前者参数量小于后者。

本文讨论了在卷积神经网络中,为何选择333x333的卷积核进行两次操作比555x555的卷积一次更优,重点在于参数量减少和相同感受野的特性。

3514

被折叠的 条评论
为什么被折叠?



