说明:由于内容太多,所以进行了拆分。本部分承接前文:【NLP】第十二章:Transformer原理、计算流程以及代码实现-2-CSDN博客
五、手动计算Transformer,展示各个环节的数据流
学习神经网络模型的核心就是清晰各个环节的数据流,也就是各个环节的数据的形式和维度,和每个环节的原理互相佐证,清晰了解pytorch的实现流程,你才能在pytorch框架下对模型进行魔改,以及轻松debug一些意外情况。所以本部分将展示一个完整的、清晰的、极简的Transformer模型的数据流。让原理、pytorch实现、手动计算三者互相印证,相互补充。
1、整理输入编码器和解码器的数据
根据上个篇章(三)的分步操作,这里我再展示一下整个处理过程:

所以,编码器输入是f1_enc、解码器的输入是f1_dec:
订阅专栏 解锁全文

5936

被折叠的 条评论
为什么被折叠?



