1. 引言
2. 摘要
文档级关系提取的目的是提取文档中实体之间的关系。与句子级关系提取不同,它需要在文档中对多个句子进行推理。本文提出了一种具有双图特征的图聚合推理网络(GAIN)。GAIN首先构建了一个异构的提到级图(hMG)来建模文档中不同提到之间的复杂交互。构造了实体层图,并在此基础上提出了一种新的路径推理机制来推断实体之间的关系。在公共数据集DocRED上进行的实验表明,与之前的技术相比,GAIN取得了显著的性能改进。
3. 动机
如图1所示,由于主语和宾语出现在同一个句子中,很容易识别句内关系(马里兰州,国家,美国)、(巴尔的摩,位于马里兰州的行政领土实体)和(埃尔德斯堡,位于马里兰州的行政领土实体)。然而,预测巴尔的摩和美国以及埃尔德斯堡和美国之间的句际关系不是小事,它们的提及不出现在同一个句子中,并且具有远距离依赖性。此外,这两个关系实例的识别也需要逻辑推理。
文档级RE中以前的工作不考虑推理,或仅使用基于图的或分层的神经网络以隐式方式进行推理。本文提出了一种用于文档级关系抽取的图聚合推理网络。它旨在直接应对上述挑战。GAIN构建了一个异构的提级图,该图具有两种类型的节点,即mention节点和文档节点,以及三种不同类型的边,即实体内边、实体间边和文档边,以获取文档中实体的上下文信息。然后,我们将图形卷积网络应用于HMG,以获得每次mention的文档感知表示。实体级图(EG)是通过合并HMG中引用同一实体的提及来构建的,在此基础上,我们提出了一种新的路径推理机制。这种推理机制允许我们的模型推断实体之间的多跳关系。
4. 创新点
- 为了更好地处理文档级可重构任务,我们提出了一种新的方法——图聚合推理网络,它采用了双图设计。
- 我们引入了一个异构的mention级别图(HMG),它带有一个基于图的神经网络,用于对文档中不同提及之间的交互进行建模,并提供文档感知提及表示。
- 我们引入了实体级图,并为实体间的关系推理提出了一种新的路径推理机制。