吴恩达机器学习第5课笔记
神经网络反向传播
吴恩达的机器学习的笔记已经很多了,本文只是记录一个一直没搞清楚的问题
在课程中计算反向传播的时候,关于输出层的误差直接就给出了
δL=y−aL. \delta^{L}=y-a^{L}. δL=y−aL.
一直很疑惑,按照公式推算应该是
δL=∂C∂zL=∂C∂aL∂aL∂zL=∂C∂aLσ′(zL). \delta^L=\frac{\partial C}{\partial z^L}=\frac{\partial C}{\partial a^L}\frac{\partial a^L}{\partial z^L}=\frac{\partial C}{\partial a^L}\sigma'(z^L) . δL=∂zL∂C=∂aL∂C∂zL∂aL=

这篇博客详细记录了吴恩达机器学习课程中关于神经网络反向传播的一个疑问,即输出层误差δ的计算。通常 δL 计算为 y - aL,作者通过成本函数C的推导证明了这一点,C由交叉熵构成,δL最终简化为(y - aL),解释了为何可以直接用预测值和真实值的差来表示输出层误差。

1212

被折叠的 条评论
为什么被折叠?



