反向传播输出层误差 δ

这篇博客详细记录了吴恩达机器学习课程中关于神经网络反向传播的一个疑问,即输出层误差δ的计算。通常 δL 计算为 y - aL,作者通过成本函数C的推导证明了这一点,C由交叉熵构成,δL最终简化为(y - aL),解释了为何可以直接用预测值和真实值的差来表示输出层误差。

吴恩达机器学习第5课笔记

神经网络反向传播

吴恩达的机器学习的笔记已经很多了,本文只是记录一个一直没搞清楚的问题
在课程中计算反向传播的时候,关于输出层的误差直接就给出了
δL=y−aL. \delta^{L}=y-a^{L}. δL=yaL.
一直很疑惑,按照公式推算应该是
δL=∂C∂zL=∂C∂aL∂aL∂zL=∂C∂aLσ′(zL). \delta^L=\frac{\partial C}{\partial z^L}=\frac{\partial C}{\partial a^L}\frac{\partial a^L}{\partial z^L}=\frac{\partial C}{\partial a^L}\sigma'(z^L) . δL=zLC=aLCzLaL=

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值