yangyang12138

人机交互

1.概述

  人机交互包括两个模型,第一个模型Retrieval-based Model,基于检索的模型,generation-based基于生成的模型

2.数据源介绍

  训练集包括四部分,第一部分是上下文source,聊天记录target,背景知识knowledge,聊天目标goal(start->topic1->topic2),测试集不包含target

3.Retrieval-based模型

  

 

目标是找到一个最大的p,p(l = 1|Y, X, K, G)

模型包含两大部分

上下文响应表示模块(编码器),知识表示模块(知识编码器),知识推理模块(知识推理器)以及匹配模块(匹配器)。

其中Encoder使用BERT模型,得到结果记做xy

Knowledge Encoder使用GRU模型,

ki = [ht,h0]

h0,ht分别代表两个方向GRU的最后和初始隐藏状态。对话的目标是

同时结合相关知识

将这些信息融合到响应排名中.

 

 

 

最后通过mlp模型

 

4.generation-based模型

 

为了生成知识驱动的对话响应,我们增强了vanilla seq2seq模型有了额外的知识选择范式,

知识感知生成器,包括四个部分:话语编码器、知识编码器、知识管理器和解码器。

对于每个给定的对话上下文X,以及对话目标G和相关知识K

知识感知生成器首先对所有输入进行编码语音编码器中的矢量信息

以及知识编码器。中的编码方法

这两个模块还使用双向GRU,类似于基于检索的方法。特别是对话语境X与对话目标

G按顺序融合到同一向量x中把G和X连接成一个句子,然后输入编码器。

 

我们介绍了两种不同的分布:1)

先验分布p(ki|x) 以及后面

分布p(ki|x,y)。我们取先验分布p(ki|x) 作为知识的推理机器与后验分布|x,y)作为人类推理的知识,然后

通过最小化来强迫机器模仿人类两个分布之间的KLDivLoss,可以表述为

 

训练时kc向量

 

预测时kc向量

 

BOW Loss

 

 

 

分类:

技术点:

相关文章: