图神经网络,强化学习,对话策略 对话状态:food=chinese 置信状态(分布):food= chinese 0.6,italian 0.4 简单的聚合函数是平均,下边是两种改进方案: 【词级别信息引入网络?】 相关文章: 2021-06-23 2021-10-24 2022-01-24 2021-10-19 2021-05-03 2022-01-13 2021-12-17 2021-06-30