原文:《Learning both Weights and Connections for Efficient Neural Networks》
目录
前期知识
参数量和计算量
参数量
参数量:模型中所有带参数的层的权重参数总量
cv类网络中主要有:卷积层、BN层、全连接层等
(注意:激活函数层、Pooling层、Upsample层是没有可学习参数的,只是提供了非线性变换)
卷积层: K ∗ K ∗ C i ∗ C o + C o K * K * C_i * C_o + C_o K∗K∗Ci∗Co+Co (最后的 C o C_o Co 是指 bias)( K K K 为卷积核边长)
BN层: 2 ∗ C i 2 * C_i 2∗Ci
全连接层: C i ∗ C o + C o C_i * C_o + C_o Ci∗Co+Co
计算量
FLOPs:floating-point operations per second,即每秒浮点运算次数
卷积层:如下图所示

全连接层: ( 2 ∗ C i − 1 ) ∗ C o (2 * C_i - 1) * C_o (2∗Ci−1)∗C

本文介绍了网络轻量化的一种方法——非结构化剪枝,包括参数量和计算量的分析,L1和L2正则化的区别,以及三步剪枝方法。通过在神经网络中加入正则化,可以加速剪枝过程,减少fine-tuning的时间。此外,还探讨了结构化剪枝的思路,如何根据权重重要性设置mask。

1489

被折叠的 条评论
为什么被折叠?



