别小看1x1卷积！用Python手写降维升维的完整实验指南

最新推荐文章于 2026-06-24 10:23:40 发布

原创

最新推荐文章于 2026-06-24 10:23:40 发布 · 604 阅读

标签

#深度学习 #1x1卷积核 #CNN #卷积神经网络

收录于

1x1卷积核的降维与升维实战：从原理到NumPy实现

1. 重新认识1x1卷积的价值

在深度学习领域，1x1卷积核常被初学者误解为"无用的操作"，但实际上它是现代卷积神经网络中最高效的"维度魔术师"。2014年GoogleNet的Inception模块首次大规模应用1x1卷积，使得网络在保持性能的同时减少了80%的计算量。这种看似简单的操作背后，隐藏着精妙的数学原理和工程智慧。

传统卷积操作需要同时处理空间维度（高度和宽度）和通道维度，而1x1卷积专注于通道维度的信息重组。想象一下，当特征图通道数达到512甚至1024时，3x3卷积的参数数量会变得极其庞大。1x1卷积就像一位高效的交通指挥员，在不改变车辆（特征）空间位置的情况下，重新组织不同车道（通道）的车辆流向。

2. 降维与升维的数学本质

2.1 通道维度的线性组合

1x1卷积的本质是通道间的加权求和。假设输入特征图大小为H×W×C₁，使用C₂个1x1卷积核，则每个输出通道都是所有输入通道的线性组合：

# 伪代码展示1x1卷积的数学本质
output[:,:,k] = sum(input[:,:,i] * weight[k,i,0,0] for i in range(C₁)) + bias[k]

这种操作在数学上等价于：

将每个空间位置的特征向量（长度为C₁）与权重矩阵（C₂×C₁）相乘
结果向量的每个元素对应一个输出通道在该位置的值

2.2 参数量对比分析

通过表格对比不同卷积核的参数量：

卷积类型	输入尺寸	输出尺寸	卷积核尺寸	参数量公式	示例参数量
3x3卷积	H×W×64

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

7up55

关注关注

24
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【6】1×1 卷积核的作用？(附实例）

04-18

4550

目录：part I ：来源part II ：应用part III ：作用（降维、升维、跨通道交互、增加非线性）part IV ：从fully-connected layers的角度理解一、来源：[1312.4400] Network In Network （如果1×1卷积核接在普通的卷积层后面，配合激活函数，就可以实现network in network的结构了。）二、应用：GoogleNe...

参与评论您还未登录，请先登录后发表或查看评论

Python计算机视觉_实现手写体识别

qq_37772863的博客

06-02

1万+

文章目录一、minist数据集的特点二、思路三、原理介绍四、实现过程1、代码：五、分析总结一、minist数据集的特点 minist数据集可以在 http://yann.lecun.com/exdb/mnist/ 获取，它包含以下四个部分： t10k-images-idx3-ubyte：包含10000个样本 t10k-labels-idx1-ubyte：包含10000个标签 train-ima...

Tensorflow基于卷积神经网络(CNN)的手写数字识别

wangTongGen

05-17

8973

一、简介本项目在Tensorflow平台下利用卷积神经网络(CNN)实现了对mnist数据集(28*28)的手写数字图片的识别，通过5000*50个样本训练后，对500个样本进行测试，准确率可以达到95%左右。本文完整代码：https://github.com/iapcoder/cnnMnistRecognition。二、mnist数据集简介 MNIST(Mixed National I...

卷积神经网络（CNN)mnist手写字python源代码详解

qq_43043256的博客

04-15

8220

首先介绍下卷积神经网络 输入层我就不讲了，我主要根据代码讲下卷积层，池化层，全连接层。（一）卷积层 ''' -1代表着矩阵行不确定我这里用n表示,[-1,28,28,1]的意思是n行28列，它的子元素是一个28行1列的矩阵，例如 [[[[1]], [[1]], [[1]], [[1]]], [[[1]], [[1]], [[1]], [[1]]]] 可以表示为【2，4,1,1】它的子元素...

基于CNN卷积神经网络手写数字识别模型

qq_42100276的博客

11-06

6624

基于CNN手写数字识别模型训练一、CNN（卷积神经网络）简介二、实验设计实验结果最终代码一、CNN（卷积神经网络）简介 1.1 卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一，在图像处理和识别的方向上取得很大的成就，本文只要进行的是基于CNN卷积神经网络的数字识别模型训练。 1.2 卷积神经网络结构：输入层——隐藏层——输出层，其中隐藏层包括卷积层（Convolution）、池化层(Pooling)、全连接层(Dense)，其结构基本如下二、实验设计 2.1 实验

如何使用Python+Opencv中的PCA给卷积神经网络特征降维

XL-STUDIO

04-24

2238

记录一个小实验，如何给卷积神经网络的特征值降维，在保证特征可判别性的同时减小特征值个数。我们使用六组图片进行实验：实验环境： opencv-python 4.4.0.44 numpy 1.18.5 torch 1.0.1 1、首先，使用别人训练好的senet-101模型提取六张图片的特征值，得到6个2048维的特征向量。 2、用余弦相似度分别计算P1P2、D1D2、S1S2的相似度，分别是0.633、0.879、0.637。分别计算P1S1、D1P1、S1D1、P2S2、D2P2.

【亲测免费】手写数字识别：Python实现卷积神经网络的完整指南

gitblog_09741的博客

10-22

1046

手写数字识别：Python实现卷积神经网络的完整指南去发现同类优质开源项目:https://gitcode.com/ 项目介绍手写数字识别是计算机视觉领域中的一个经典问题，广泛应用于邮政编码识别、银行支票处理等实际场景。本项目提供了一个完整的Python实现手写数字识别任务的指南，通过构建卷积神经网络（CNN）模型，帮助用户实现对手写数字的高精度识别。项目技术分析 1. 数据集准备项目推荐...

实验一：LeNet结构对于MNIST手写数字体识别

Cloris_hao的博客

12-17

2004

使用MNIST手写数字体数据集进行训练和预测，实现测试集准确率达到98%及以上。本实验的目的：掌握卷积神经网络基本原理，以LeNet为例掌握主流框架的基本用法以及构建卷积神经网络的基本操作了解如何使用GPU。

python神经网络案例——CNN卷积神经网络实现mnist手写体识别

热门推荐

01-18

8万+

全栈工程师开发手册（作者：栾鹏） python教程全解 CNN卷积神经网络的理论教程参考 http://blog.csdn.net/luanpeng825485697/article/details/79009241 加载样本数据集首先我们要有手写体的数据集文件 t10k-images.idx3-ubyte t10k-labels.idx1-ubyte train-imag...

卷积神经网络实现手写数字识别（纯numpy实现）

Keras深度学习

01-19

4万+

前面讲解了使用纯numpy实现数值微分和误差反向传播法的手写数字识别，这两种网络都是使用全连接层的结构。全连接层存在什么问题呢？那就是数据的形状被“忽视”了。比如，输入数据是图像时，图像通常是高、长、通道方向上的3维形状。但是，向全连接层输入时，需要将3维数据拉平为1维数据。实际上，前面提到的使用了MNIST数据集的例子中，输入图像就是1通道、高28像素、长28像素的（1, 28, 28）形状，但却被排成1列，以784个数据的形式输入到最开始的Affine层。图像是3维形状，这个形状中应该含有重要的空间信

python卷积神经网络（CNN）手写数字识别实现详解

import_torch_as_tf

09-27

8514

卷积神经网络经典案例，手写数字识别代码详解，注释之处如有错误，欢迎指正 from tensorflow.examples.tutorials.mnist import input_data import tensorflow as tf #初始化权重函数 def weight_variable(shape): initial = tf.truncated_normal(shape,s...

InceptionV1----1*1卷积降维

weixin_30709061的博客

05-05

842

使用5x5的卷积核仍然会带来巨大的计算量。为此，文章借鉴NIN，采用1x1卷积核来进行降维。例如：上一层的输出为100x100x128，经过具有256个输出的5x5卷积层之后(stride=1，pad=2)，输出数据为100x100x256。其中，卷积层的参数为128x5x5x256。假如上一层输出先经过具有32个输出的1x1卷积层，再经过具有256个输出的5x5卷积层，那么最终的输出数据仍...

python pca降维常见问题_关于PCA降维中遇到的python问题小结

weixin_39652136的博客

12-04

969

由于论文需要，开始逐渐的学习CNN关于文本抽取的问题，由于语言功底不好，所以在学习中难免会有很多函数不会用的情况.....￣へ￣主要是我自己的原因，但是我更多的把语言当成是一个工具，需要的时候查找就行~~~~但是这也仅限于搬砖的时候，大多数时候如果要自己写代码，这个还是行不通的。简单的说一下在PCA，第一次接触这个名词还是在学习有关CNN算法时，一篇博客提到的数据输入层中，数据简单处理的几种方法之...

基于Python卷积神经网络(CNN)的mnist手写数字识别

weixin_62375676的博客

03-24

1180

数字识别系统设计与实现

基于Python实现手写数字识别

需要远程指导仿真实验、代码有问题的，请后台私信或者关注公众号

07-03

1641

利用python及Keras建立神经网络对手写数字识别

Python ：MNIST手写数据集识别 + 手写板程序最详细，直接放心，大胆地抄！跑不通找我，我包教！

qq_37543124的博客

03-03

3万+

利用Python语言编写和调试一个识别手写数字图像的三层深度前馈网络，包括数据预处理，网络模型构建，模型参数初始化和正向推理，反向梯度下降参数寻优，最后模型预测的功能。目的是学会基本的深度网络模型建立、训练和推理过程，理解深度网络的实现原理。

使用python完成手写数字识别

大泽九章

04-03

3096

入门图像识别的第一个案例，看到好多小伙伴分享，也把自己当初的思路捋捋，写成一篇博客，作为记录和分享，也欢迎各位交流讨论。

5 手写卷积函数

Leezed525的博客

06-28

721

对于卷积层的具体操作，我这里就不在具体说卷积具体是什么东西了。对于手写卷积操作而言，有两种方式，一种就是最朴素的通过滑动窗口来实现的方式，另一种方式就是使用矩阵乘法来简化操作过程的方式。

Python手写数字识别+GUI界面+手写板设计

鲁棒最小二乘支持向量机

01-22

1万+

本文使用Python基于TensorFlow 卷积神经网络设计手写数字识别算法，并编程实现GUI 界面，构建手写数字识别系统。本系统界面设计友好，功能完善。通过测试，本识别系统对于较规范的手写体数字的识别达到了很好的识别效果。

#从零到一搭建微博情感分类系统：基于BiLSTM的PyTorch完整实战教程【3W字保姆级详解】