阅读 A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots

最新推荐文章于 2026-06-23 15:36:20 发布

原创最新推荐文章于 2026-06-23 15:36:20 发布 · 1.3k 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#git #知识图谱 #人工智能

检索式对话论文阅读专栏收录该内容

2 篇文章

订阅专栏

Abstract

已经存在的工作要么将句子联结起来并入上下文要么用一个高密度的上下文向量匹配回复，这样会损失掉句子之间的相关性，或者是重要的上下文语境信息，因此提出序列化匹配网络解决这两个问题。
SMN首先在对话中的每一个句子以多粒度的方式与回复进行匹配，然后从每一对句子中用卷积核池化操作蒸馏出重要匹配信息并用向量表示，之后通过RNN网络建模句子之间的关系，以时间的顺序将向量累计起来，最终用RNN隐藏层状态计算匹配分数。

Introduction

在多轮对话中，关键性问题是：1、怎么在上下文中分别出关键信息出来(关键字、关键词、关键句子)，这个对于选择合适的回复以及利用相关信息进行匹配非常关键。2、在上下文中如何建模多轮对话间的关系
现有模型的缺陷：在上下文中容易丢失重要信息，因为他们首先将整个上下文表示为向量，然后将该上下文与response sentence向量进行匹配
为了避免信息丢失，SMN在开始的时候将回复sentence与上下文中的每条语句进行匹配，并将匹配的每对中重要信息编码入匹配向量(注：这是CNN阶段，解决上述难点1)；然后按照话语的时间顺序，对匹配的向量进行堆积，以对其关系进行建模(注：即构建GRU2，解决上述难点2)，在最后的匹配阶段，就是计算这些堆积的匹配向量。

模型图：

在这里插入图片描述

Sequential Matching Network

1 . Sequential Matching Network

D为数据集合， $D ={(y_{i},s_{i},r_{i})}_{i=1}^{N}$ ； $s_{i} = \{ u_{i,1},...,u_{i,n_{i}} \}$ 表示对话上下文,其中 ${u_{i,k} \}_{k=1}^{n_{i}}$ 表示为句子； $r_{i}$ 表示为候选response； $yi∈{0,1}y_{i} \in \{0,1 \}$ 当$y_{i} = 1 $时，表示 $r_{i}$ 为合适的回复，否则是不合适的回复。g(s, r) 表示 context-response对匹配等级

2、Model Overview

SMN首先对context-response 匹配对分解为一系列utterance-response 匹配对，之后通过RNN将一系列的utterance-response匹配对累积，SMN有三层组成：第一层：使用对话的每一句与response在word level 和segment level进行匹配，然后通过CNN和pool对这两个level提取关键信息编码为匹配向量，匹配向量输入第二层；第二次层利用GRU以时间顺序将匹配向量进行堆积，将隐层状态输入第三层；第三层计算最终的匹配secore