【pytorch】LSTM神经网络

最新推荐文章于 2026-04-23 10:00:45 发布

原创

最新推荐文章于 2026-04-23 10:00:45 发布 · 3k 阅读

·

0

·

标签

#神经网络 #pytorch #lstm

本文详细介绍了LSTM（长短期记忆网络）和GRU（门控循环单元）两种时序数据处理的神经网络结构。相较于GRU的两个门（重置门和更新门），LSTM拥有三个门（遗忘门、输入门和输出门）以及两个状态（记忆状态和隐状态），使其在处理长期依赖问题时更为强大。LSTM的复杂性在于其额外的控制门，这允许更精细地管理信息流。文章还给出了使用PyTorch实现LSTM的代码示例，包括如何初始化网络状态。

在处理时序数据，已经有RNN循环神经网络和GRU神经网络两个比较经典的网络。当然还有一种LSTM神经网络，长短期记忆神经网络。
从发展历史来看，是现有LSTM再有GRU的，但是从复杂度来看，LSTM比GRU更加复杂。

先来回忆一下GRU，其有两个门（更新门和重置门），有一个记录历史信息的向量 $H_t$ 。
而LSTM就更加复杂了，无论是在门的数量上还是记录历史信息的向量上。

LSTM神经网络

其一共有3个门，2个状态。
在这里插入图片描述

控制门

遗忘门

这个与GRU中的重置门非常类似，含义也是大致相同。
$F_t = \Theta\left(X_t\cdot W_{xf} + H_{t - 1}\cdot W_{hf} + b_f\right)$
而后， $F_t$ 作用于记忆 $C_{t-1}$

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。