第1周-深度学习简介
【总结】
-
Scale drives deep learnig progress:Data,Computation,Algorithms
-
非结构化数据:图片,音频,文本
-
ReLUReLUReLU (Rectified Linear Unit) 修正线性单元

相比于其它激活函数来说,ReLUReLUReLU有以下优势:
- 计算梯度简单,梯度下降更快;
- ReLUReLUReLU由于非负区间的梯度为常数,因此能够解决 sigmoidsigmoidsigmoid 存在的梯度消失问题,使得模型的收敛速度维持在一个稳定状态;
- ReLUReLUReLU会使一部分神经元的输出为0,这样就造成了网络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生。
第2周 神经网络基础
【总结】
-
神经元节点先计算线性函数(z=Wx+bz = Wx + bz=Wx+b),再计算激活。
-
logisticlogisticlogistic 回归的loss function:

logisticlogisticlogistic 回归的cost function:

-
将一个(32,32,3)的数组转换为列向量?
x = img.reshape((32 * 32 * 3, 1))
- python中的广播机制(
broadcasting)
- 简单来说,broadcasting可以这样理解:如果你有一个m∗nm * nm∗n的矩阵,让它加减乘除一个1∗n1 * n1∗n(或 m∗1m * 1m∗1)的矩阵,它会被复制 mmm (或 nnn ) 次,成为一个 m∗nm * nm

该博客介绍了吴恩达深度学习课程的内容,包括深度学习简介、神经网络基础、浅层神经网络和深度学习的关键概念。重点讨论了ReLU激活函数的优势、神经元的线性函数与激活、激活函数如sigmoid与tanh的用途、参数初始化的重要性以及在深度神经网络中向量化计算的挑战。此外,还提到了超参数、前向传播与反向传播的cache机制,以及如何初始化模型参数。

785

被折叠的 条评论
为什么被折叠?



