飞桨 计算机视觉部分笔记

参加了飞桨的0基础入门课程,转眼间已经第二周了。第二周主要介绍了计算机视觉部分,也总算是进入正题了呢~
说到计算机视觉就不得不提到其中重要的模型结构,卷积神经网络(CNN)。所以课程首先介绍了CNN常用的基本模块。

常用模块

1. 卷积:

卷积计算

既然是卷积神经网络,那卷积必不可少啊。卷积就是通过卷积核与原始数据进行运算从而得到原始图像的部分特征。而卷积运算的方法就是将卷积核各项与对应数据项相乘再相加。通过paddlepaddle的api来进行进一步理解。

class paddle.fluid.dygraph.Conv2D(num_channels, num_filters, filter_size, stride=1, padding=0, dilation=1, groups=None, param_attr=None, bias_attr=None, use_cudnn=True, act=None, dtype='float32')

num_channels:输入通道数。对于第一层卷积输入通道数取决于输入的图片类型,灰度图片通道数为1,彩色图片通道数为3。而其他卷积层输入通道数取决于上一层。
num_filters:输出通道数,也就是卷积层输出数据通道数,根据模型自己定义。实现的方法就是通过改变卷积核的通道数(即卷积核组的数量)从而改变输出通道数。
filter_size:卷积核大小。卷积核的大小可以决定下一层的感受野。那么什么是感受野,感受野就是:

输出特征图上每个点的数值,是由输入图片上大小为kh×kwk_h\times k_wkh​×kw​的区域的元素与卷积核每个元素相乘再相加得到的,所以输入图像上kh×kwk_h\times k_wkh​×kw​区域内每个元素数值的改变,都会影响输出点的像素值。我们将这个区域叫做输出特征图上对应点的感受野。感受野内每个元素数值的变动,都会影响输出点的数值变化。比如3×33\times33×3卷积对应的感受野大小就是3×33\times33×3。

通俗来说就是输出特征图每个点大小受输入特征图形象的范围。
stride:步长,默认为[1,1],也就是卷积核每次向水平方向以及竖直方

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值