【发布时间】:2018-10-10 20:45:36
【问题描述】:
我正在尝试使用 OLLIE 和 Stanford Core NLP 的 OpenIE 工具来提取三元组。
我已经安装了 stanford-corenlp-3.9.1 和 stanford-corenlp-3.9.2 来尝试从文本中提取三元组。
对于 stanford-corenlp-3.9.1:
- 只能使用默认方法提取信息,尽管添加了标志“-format ollie”或“-openie.format ollie”
-
我用这句话测试过
有人说巴拉克奥巴马不是在美国出生的。
应该产生这个:
(巴拉克·奥巴马;不是出生在;美国)[attrib=有人说]
这是测试 OpenIE 方法是否确实是 ollie 的示例。但我没有得到三倍。但是,它确实适用于其他句子,但输出是默认方法的输出。
对于 stanford-corenlp-3.9.2:
-
我根本无法提取任何三元组,而是得到了这个错误。
'java.lang.IllegalArgumentException: annotator "openie" requires annotation "CorefChainAnnotation". The usual requirements for this annotator are: tokenize,ssplit,pos,lemma,depparse,natlog'
编辑:
- 事实证明,Stanford OpenIE 不支持 OLLIE,并且这些标志只是将输出更改为 OLLIE 的格式。
- 能够运行3.9.2版本(见下方回复)。
【问题讨论】:
标签: nlp stanford-nlp