例如:
形状为(M, Dy),
为(M, Dx),W为(Dx, Dy),b为(M, Dy)
反向传播更新参数的时候,需要x+dx,所以x或dx的形状相同
由下游反向传播之后形状为 (M, Dy)
形状为 (M, Dx)
形状为(Dx, Dy)
本文探讨了在深度学习中,反向传播算法如何通过计算梯度来更新神经网络的参数。具体分析了输入数据(形状为(M,Dx))、权重矩阵W(形状为(Dx,Dy))和偏差b(形状为(M,Dy))在反向传播过程中的作用,以及它们如何影响参数的更新。
例如:
形状为(M, Dy),
为(M, Dx),W为(Dx, Dy),b为(M, Dy)
反向传播更新参数的时候,需要x+dx,所以x或dx的形状相同
由下游反向传播之后形状为 (M, Dy)
形状为 (M, Dx)
形状为(Dx, Dy)
1281
1741

被折叠的 条评论
为什么被折叠?
