对于模型而言一般包含四个部分:输入、输出、网络结构、训练相关。如果想要改善模型,就可以从这四个部分入手。
● 输入:数据 --> Data Augmentation
● 输出:Loss相关
● 网络结构:Activation Function etc.
● 训练相关:Regularization etc.
这篇文章主要讲解Data Augmentation部分。
Data Augmentation简介
数据增强主要是指在计算机视觉领域中对图像进行数据增强,从而弥补训练图像数据集的不足,达到对训练数据扩充的目的。数据增强可分为同类增强(如:翻转、旋转、缩放、移位、模糊等)和混类增强(如 mixup)两种方式。
1. 同类增强
1)翻转(Flip)
可分为水平翻转、垂直翻转。
2)旋转(Rotation)
3)缩放(Scale)
向外缩放:最终图像尺寸将大于原始图像尺寸,大多数图像框架从新图像中剪切出一个部分,其大小等于原始图像。向内缩放:因为它会缩小图像尺寸,迫使我们对超出边界的内容作出假设。
4) 随机裁剪(Random Crop)
&n

本文详细介绍数据增强技术在计算机视觉领域的应用,包括同类增强(如翻转、旋转等)与混类增强(如Mixup、Cutout等)的方法及其实现原理。通过这些技术可以有效扩大训练数据集规模,提升模型泛化能力。

1万+

被折叠的 条评论
为什么被折叠?



