Backto DeepLearning Index
dilation
dilation 是对 kernel 进行膨胀,多出来的空隙用 0 padding。用于克服 stride 中造成的 失真问题。

对应关系是
k
d
=
(
k
−
1
)
×
d
+
1
k_{d} = (k -1)\times d + 1
kd=(k−1)×d+1, 对原始kernel 进行 d 倍 dilation 之后得到新的
k
d
k_d
kd,
k
k
k 一般是奇数,
d
d
d 一般是偶数,从而保证了
k
d
k_d
kd 也是奇数。注意,使用dilation的时候,先把
k
k
k dilation 成
k
d
k_d
kd, 去卷积运算,生成下一层的 feature map。但是参数存储的还是原始的
k
k
k 的大小.
引入 dilation 的目的是 既想利用已经训练好的模型进行fine-tuning,又想改变网络结构得到更加dense的score map.. 如下图 p0-s0-d2

这样最大的好处就是卷积核的参数没变(还是9个),但是感受野从 3x3 变成了 5x5. 虽然一个格子,计算的是5x5 感受野里的
9
9
9 个格子,但是卷积核整体看到了 7x7 的field,而不是 dilation 之前 5x5 的 field。
本文探讨了卷积膨胀(Dilation)在深度学习中的作用,旨在克服传统卷积导致的失真问题。通过膨胀操作,使得卷积核的感受野增加,而参数数量保持不变,有效扩大了模型的视野,且详细介绍了kd=(k-1)×d+1的关系。文章引用了相关资源,深入解析了Dilation在Caffe-SSD中的Hole算法实现。

8954

被折叠的 条评论
为什么被折叠?



