计算机视觉深度学习基础:人工神经网络入门
1. 人工神经网络基础概述
人工神经网络(ANN)是一种受人类大脑功能启发的监督学习算法。它通过接受输入,将其传递通过一系列函数,激活后续神经元,最终产生输出,类似于人类大脑中神经元的连接和激活方式。
1.1 ANN架构与训练
存在多种标准的ANN架构,根据通用逼近定理,我们总能找到一个足够大且权重合适的神经网络架构,能对任何给定输入精确预测输出。对于特定数据集或任务,我们可以创建一个架构,并不断调整其权重,直到ANN能做出我们期望的预测,这个调整权重以让ANN学会执行任务的过程就是训练神经网络。ANN能够处理大规模数据集并适应定制架构,这使其在解决各种相关任务中备受瞩目。
1.2 在计算机视觉中的应用
在计算机视觉领域,识别图像中物体的类别是一项重要任务。以ImageNet竞赛为例,2012年神经网络(AlexNet)赢得了该竞赛,自那以后,随着更深度、更复杂的神经网络的出现,分类错误率持续降低,甚至超越了人类水平。此外,神经网络不仅在图像分类、目标检测和分割等任务中达到了人类水平,还催生了一系列全新的应用场景,如生成式AI(GenAI),它可以通过以下多种方式生成内容:
- 从输入文本生成图像
- 从输入图像和文本生成新颖的自定义图像
- 利用多种输入模态(图像、文本和音频)的内容生成新内容
- 从文本/图像输入生成视频
1.3 学习目标
接下来,我们将在一个简单数据集上创建一个简单的架构,重点关注ANN的各个构建块(前馈传播、反向传播和学习率)如何帮助调整权重,使网络学会根据给定输入预测预期输出。我们将
超级会员免费看
订阅专栏 解锁全文

3354

被折叠的 条评论
为什么被折叠?



