人机交互

1.概述

　　人机交互包括两个模型，第一个模型Retrieval-based Model,基于检索的模型，generation-based基于生成的模型

2.数据源介绍

　　训练集包括四部分，第一部分是上下文source，聊天记录target，背景知识knowledge，聊天目标goal(start->topic1->topic2),测试集不包含target

3.Retrieval-based模型

目标是找到一个最大的p，p(l = 1|Y, X, K, G)

模型包含两大部分

上下文响应表示模块（编码器），知识表示模块（知识编码器），知识推理模块（知识推理器）以及匹配模块（匹配器）。

其中Encoder使用BERT模型，得到结果记做xy

Knowledge Encoder使用GRU模型，

ki = [ht,h0]

h0,ht分别代表两个方向GRU的最后和初始隐藏状态。对话的目标是

同时结合相关知识

将这些信息融合到响应排名中.

最后通过mlp模型

4.generation-based模型

为了生成知识驱动的对话响应，我们增强了vanilla seq2seq模型有了额外的知识选择范式，

知识感知生成器，包括四个部分：话语编码器、知识编码器、知识管理器和解码器。

对于每个给定的对话上下文X，以及对话目标G和相关知识K

知识感知生成器首先对所有输入进行编码语音编码器中的矢量信息

以及知识编码器。中的编码方法

这两个模块还使用双向GRU，类似于基于检索的方法。特别是对话语境X与对话目标

G按顺序融合到同一向量x中把G和X连接成一个句子，然后输入编码器。

我们介绍了两种不同的分布：1）

先验分布p（ki|x）以及后面

分布p（ki|x,y）。我们取先验分布p（ki|x）作为知识的推理机器与后验分布|x,y）作为人类推理的知识，然后

通过最小化来强迫机器模仿人类两个分布之间的KLDivLoss，可以表述为

训练时kc向量

预测时kc向量

BOW Loss