网络轻量化 - 非结构化剪枝

本文介绍了网络轻量化的一种方法——非结构化剪枝,包括参数量和计算量的分析,L1和L2正则化的区别,以及三步剪枝方法。通过在神经网络中加入正则化,可以加速剪枝过程,减少fine-tuning的时间。此外,还探讨了结构化剪枝的思路,如何根据权重重要性设置mask。

原文:《Learning both Weights and Connections for Efficient Neural Networks》

前期知识

参数量和计算量

参数量

参数量:模型中所有带参数的层的权重参数总量

cv类网络中主要有:卷积层、BN层、全连接层等
(注意:激活函数层、Pooling层、Upsample层是没有可学习参数的,只是提供了非线性变换)
卷积层: K ∗ K ∗ C i ∗ C o + C o K * K * C_i * C_o + C_o KKCiCo+Co (最后的 C o C_o Co 是指 bias)( K K K 为卷积核边长)
BN层: 2 ∗ C i 2 * C_i 2Ci
全连接层: C i ∗ C o + C o C_i * C_o + C_o CiCo+Co

计算量

FLOPs:floating-point operations per second,即每秒浮点运算次数

卷积层:如下图所示
在这里插入图片描述
全连接层: ( 2 ∗ C i − 1 ) ∗ C o (2 * C_i - 1) * C_o (2Ci1)C

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值