MobileNet V2论文记录

最新推荐文章于 2024-02-28 14:19:07 发布

原创

最新推荐文章于 2024-02-28 14:19:07 发布 · 451 阅读

MobileNet V2通过引入逆残差块和线性瓶颈解决了MobileNet V1中Depthwise Convolution训练问题，提高了网络性能。逆残差块先扩张通道，再进行Depthwise卷积，避免ReLU导致的信息损失。实验结果表明，这种结构在减少计算量的同时保持了高精度，适合移动端应用。

概述

MobileNet V1的问题
MobileNet V1的结构非常简单，是类似VGG一样的直筒型。这种结构的性价比不高，后续一系列的ResNet，DenseNet等结构证明了通过特征复用可以极大的提高网络的性价比。Depthwise Conv确实大大减少了我们的计算量。在实际使用的时候，我们发现Depthwise部分的kernel比较容易训练废掉，训练之后发现Depthwise训练出来的kernel有不少都是空的。因为Depthwise每个kernel dim相对于普通Conv要小的多，过于小的kernel dim加上ReLU的激活影响下，使得神经元输出很容易变为0，所以就学废了。ReLU对于0的输出的梯度维0，所以一旦陷入0输出，就没法恢复了。我们还发现，这个问题在定点化低精度训练的时候会进一步放大。
结构特点
主要架构还是将MobileNet V1和残差网络ResNet的残差单元结合起来，用Depthwise Convolution代替残差单元的bottleneck，最重要的是和residual block相反，通常的residual block先是经过1 * 1卷积，降低特征图通道数，任何再进行3 * 3卷积，最后重新经过1 * 1卷积将特征图的通道数扩张回去。MobileNet V2中间的3 * 3卷积变成Depthwise，计算量很少，所以先经过一个1 * 1的卷积层把特征通道数进行扩张，目的为了提升通道数，获取更多的特征，再进行3 * 3深度卷积，再使用1 * 1卷积进行通道压缩。而且为了避免ReLU对特征的破坏，用线性层替换通道数较少层后的ReLU非线性激活。

MobileNet V2创新点

Inverted Residual Block
MobileNet V1没有很好利用Residual Connection，而Residual Connection通常情况下很好，所以MobileNet V2加上。与之前的residual block相反，采用先升维再降维的方法，这样

最低0.47元/天解锁文章