LSTM模型（大白话+公式推导）

原创

已于 2023-04-09 22:24:59 修改 · 5.8k 阅读

·

8

·

标签

#lstm #深度学习 #神经网络

于 2023-03-26 19:21:22 首次发布

LSTM通过记忆细胞和门控结构解决了RNN的梯度消失问题，允许模型选择性地记忆和遗忘信息，提高学习效率。在每个时间步，遗忘门、输入门和输出门协同工作，控制信息流，确保关键信息在长序列中的有效传递。

设计思路

RNN是想把所有信息都记住；不管是有用的信息还是没用的信息（存在梯度爆炸和梯度消失的问题）例子：复习的时候，整本书都想记下来；导致记忆负担加重；记忆的效果不好；
LSTM是设计一个记忆细胞；具备选择性记忆的功能，可以选择记忆重要信息，过滤掉噪声信息，减轻记忆负担（类比于：复习的时候看到考点内的信息就记忆；考点外的知识过滤掉）

前向传播的过程

RNN图

在这里插入图片描述
注意点：1、在循环神经网络(RNN)中，tanh常用作激活函数，tanh是一种非线性函数，它将输入映射到范围在-1到1之间；2、激活函数主要是：引入非线性，以便模型可以学习更加复杂的关系和模式；3、隐藏状态是一组表示模型内部状态的向量，它们通过时间步长进行传递和更新(在每个时间步长，当前输入和前一个时间步长的隐藏状态被馈送到RNN中，并生成新的隐藏状态)

LSTM图

在这里插入图片描述
其中LSTM是由两条线串起来的；上面那一条其实就是记忆细胞

单元图

在这里插入图片描述
解释：其中

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。