-
任务描述: 自动摘要是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。自动的文本摘要是非常具有挑战性的,因为当我们作为人类总结一篇文章时,我们通常会完整地阅读它以发展我们的理解,然后写一个摘要突出其要点。由于计算机缺乏人类知识和语言能力,它使自动文本摘要成为一项非常困难和艰巨的任务。自动摘要通常分为抽取式摘要和生成式摘要,区别在于抽取摘要选择原文中若干句子作为只要,而生成式摘要利用文本生成技术根据原文生成摘要,这个摘要会出现原文中没有出现过的句子和词。本教程介绍一种seq2seq+attention 生成式摘要算法。
-
数据集:其中训练集20000个数据,验证集1000个数据,测试集1000个数据。
-
运行环境:
Python==3.6 numpy==1.18.0 pandas==0.24.2 torch==1.0.0 torchtext==0.4.0 spacy==2.1.8 rouge==1.0.0 -
方法概述:本教程旨在介绍如何利用pytorch深度学
实战27:seq2seq+attention基于seq2seq+attention实现文本摘要
于 2022-11-24 09:44:59 首次发布
本文档介绍了如何使用Python和PyTorch实现基于seq2seq+attention的文本摘要模型。首先,详细阐述了数据预处理过程,包括数据整理、构建分词函数、数据加载和构建词表。接着,构建了seq2seq模型,包含encoder和decoder,以及attention机制的实现。模型训练部分包括定义训练和验证函数,以及模型的保存。在模型预测环节,实现了模型加载和预测函数,用于生成摘要。最后,对模型进行了评估,包括损失计算和ROUGE指标的探讨。整个教程涵盖了从数据预处理到模型训练、预测和评估的全过程。
订阅专栏 解锁全文

1296

被折叠的 条评论
为什么被折叠?



