对话生成方向的增强改进

摘要

高质量的对话数据的缺乏和昂贵的数据注释过程极大地限制了它们在现实环境中的应用。我们提出了一个意译增强响应生成(PARG)框架，该框架联合训练意译模型和响应生成模型来提高对话生成性能。设计了一种基于对话状态和对话行为标签的意译训练数据集自动生成方法。PARG适用于各种对话生成模型，如TSCP (Lei et al.， 2018)和DAMD (Zhang et al.， 2019)。实验结果表明，该框架进一步改进了现有的基于CamRest676和MultiWOZ的对话框模型。在对话框生成任务中，特别是在低资源设置下，PARG也显著优于其他数据扩展方法。

框架叙述

提出了一个三步的程序来寻找对话中的话语是彼此的意译。
首先，我们对会话话语进行去中心化预处理，以减少表层形式的语言变异。然后，对于每个用户的话语，我们匹配其他发挥相同功能的对话框中的话语，以找到它的意译候选词。
最后，我们过滤掉与原文相比语义相似度低或表面形式差异小的不合格意译。基于BLEU值和deversity值来进行去除，BLEU低于0.2，deversity低于3.4.
对话生成方向的增强改进

结论

在两个数据集CamRest676和MultiWOZ上验证。
对话生成方向的增强改进