设计思路
- RNN是想把所有信息都记住;不管是有用的信息还是没用的信息(存在梯度爆炸和梯度消失的问题)例子:复习的时候,整本书都想记下来;导致记忆负担加重;记忆的效果不好;
- LSTM是设计一个记忆细胞;具备选择性记忆的功能,可以选择记忆重要信息,过滤掉噪声信息,减轻记忆负担(类比于:复习的时候看到考点内的信息就记忆;考点外的知识过滤掉)
前向传播的过程
RNN图

注意点:1、在循环神经网络(RNN)中,tanh常用作激活函数,tanh是一种非线性函数,它将输入映射到范围在-1到1之间;2、激活函数主要是:引入非线性,以便模型可以学习更加复杂的关系和模式 ;3、隐藏状态是一组表示模型内部状态的向量,它们通过时间步长进行传递和更新(在每个时间步长,当前输入和前一个时间步长的隐藏状态被馈送到RNN中,并生成新的隐藏状态)
LSTM图

其中LSTM是由两条线串起来的;上面那一条其实就是记忆细胞
单元图

解释:其中

LSTM通过记忆细胞和门控结构解决了RNN的梯度消失问题,允许模型选择性地记忆和遗忘信息,提高学习效率。在每个时间步,遗忘门、输入门和输出门协同工作,控制信息流,确保关键信息在长序列中的有效传递。
&spm=1001.2101.3001.5002&articleId=129753671&d=1&t=3&u=d2bb6ad2b2654ef4a959777d15504c8c)
3万+

被折叠的 条评论
为什么被折叠?



