反向传播

chain rule used in a single neuron:
绿箭头(used to calculate z):forward pass
红箭头(used to calculate gradients of weight matrices):backward pass
在这里插入图片描述
network architecture:

z = w1x
h = sigmoid(z)
y^ = w2h
E(loss) = 1/2||y^ - y||2

在这里插入图片描述
step1:
loss function 对 hidden layer-output layer weight matrix 的导数矩阵(the same size as the original weight matrix W2):
在这里插入图片描述
step2:
loss对h和对z的导数矩阵:
在这里插入图片描述
step3:
loss function 对 input layer-hidden layer weight matrix 的导数矩阵(the same size as the original weight matrix W1):
在这里插入图片描述
Properties we use in the derivation:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
reference:

[1] https://www.bilibili.com/video/BV1h4411A7v4/?spm_id_from=333.788.videocard.3
[2] http://web.stanford.edu/class/cs224n/readings/cs224n-2019-notes03

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值