人机交互
1.概述
人机交互包括两个模型,第一个模型Retrieval-based Model,基于检索的模型,generation-based基于生成的模型
2.数据源介绍
训练集包括四部分,第一部分是上下文source,聊天记录target,背景知识knowledge,聊天目标goal(start->topic1->topic2),测试集不包含target
3.Retrieval-based模型
目标是找到一个最大的p,p(l = 1|Y, X, K, G)
模型包含两大部分
上下文响应表示模块(编码器),知识表示模块(知识编码器),知识推理模块(知识推理器)以及匹配模块(匹配器)。
其中Encoder使用BERT模型,得到结果记做xy
Knowledge Encoder使用GRU模型,
ki = [ht,h0]
h0,ht分别代表两个方向GRU的最后和初始隐藏状态。对话的目标是
同时结合相关知识
将这些信息融合到响应排名中.
最后通过mlp模型
4.generation-based模型
为了生成知识驱动的对话响应,我们增强了vanilla seq2seq模型有了额外的知识选择范式,
知识感知生成器,包括四个部分:话语编码器、知识编码器、知识管理器和解码器。
对于每个给定的对话上下文X,以及对话目标G和相关知识K
知识感知生成器首先对所有输入进行编码语音编码器中的矢量信息
以及知识编码器。中的编码方法
这两个模块还使用双向GRU,类似于基于检索的方法。特别是对话语境X与对话目标
G按顺序融合到同一向量x中把G和X连接成一个句子,然后输入编码器。
我们介绍了两种不同的分布:1)
先验分布p(ki|x) 以及后面
分布p(ki|x,y)。我们取先验分布p(ki|x) 作为知识的推理机器与后验分布|x,y)作为人类推理的知识,然后
通过最小化来强迫机器模仿人类两个分布之间的KLDivLoss,可以表述为
训练时kc向量
预测时kc向量
BOW Loss