LSTM模型(大白话+公式推导)

LSTM通过记忆细胞和门控结构解决了RNN的梯度消失问题,允许模型选择性地记忆和遗忘信息,提高学习效率。在每个时间步,遗忘门、输入门和输出门协同工作,控制信息流,确保关键信息在长序列中的有效传递。

设计思路

  • RNN是想把所有信息都记住;不管是有用的信息还是没用的信息(存在梯度爆炸和梯度消失的问题)例子:复习的时候,整本书都想记下来;导致记忆负担加重;记忆的效果不好;
  • LSTM是设计一个记忆细胞;具备选择性记忆的功能,可以选择记忆重要信息,过滤掉噪声信息,减轻记忆负担(类比于:复习的时候看到考点内的信息就记忆;考点外的知识过滤掉)

前向传播的过程

RNN图

在这里插入图片描述
注意点:1、在循环神经网络(RNN)中,tanh常用作激活函数,tanh是一种非线性函数,它将输入映射到范围在-1到1之间;2、激活函数主要是:引入非线性,以便模型可以学习更加复杂的关系和模式 ;3、隐藏状态是一组表示模型内部状态的向量,它们通过时间步长进行传递和更新(在每个时间步长,当前输入和前一个时间步长的隐藏状态被馈送到RNN中,并生成新的隐藏状态)

LSTM图

在这里插入图片描述
其中LSTM是由两条线串起来的;上面那一条其实就是记忆细胞

单元图

在这里插入图片描述
解释:其中

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值