【发布时间】:2018-10-28 02:22:57
【问题描述】:
我从非结构化文本中提取了所有必要的实体,并使用 stanford POS 标记器将其存储在字典中。现在我想提取它们之间的关系,以三元组(Entity1,Entity2,relation)的形式构建我自己的本体。我尝试了 stanford 依赖项解析器,但我不知道如何提取这些三元组。
例如: 前扩散器包括布置在风道边界壁之间的可枢转襟翼。
我想建立关系(前扩散器,可旋转的襟翼,包括); (可转动的襟翼、风道的边界壁、布置);
另一个例子:货箱包括一个集装箱,该集装箱具有底板、顶壁、前壁、侧壁和后门。
我的预期关系是(货体、集装箱、组成); (容器,地板,有); (容器,顶壁,有); (容器,前壁,有); (容器、侧壁、有); (集装箱,后门,有)。
我可以使用 stanford 依赖项解析器做什么来实现我的目标?这意味着如何导航依赖项解析树并获取结果?
【问题讨论】:
-
谢谢,我刚刚编辑了问题。
标签: python nlp stanford-nlp information-extraction