【发布时间】:2017-07-10 02:13:34
【问题描述】:
我将 CoreNLP 的最新版本 [3.8.0] 与 python 包装器 [py-corenlp] 一起使用,当我使用以下注释器进行注释时,我意识到从 CoreNLP 获得的输出之间存在一些不一致: tokenize、ssplit、pos、depparse、parse,以及来自Online Demo 的输出。更重要的是,斯坦福的 Parser,无论是在我的代码中调用它还是在我在线运行它时,都给我与 CoreNLP 相同的结果。
例如,我有以下问题(借自 Free917 问题语料库):
Marshall Hall 在什么机构担任教授
使用 CoreNLP 我得到以下解析:
(ROOT\n (SBAR\n (WHPP (IN at)\n (WHNP (WDT what)))\n (S\n (NP (NNS机构))\n (VP (VBD)\n (NP\n (NP (NNP Marshall) (NNP Hall))\n (NP (DT a) (NN 教授)))))))
与斯坦福的解析器相同:
[Tree('ROOT', [Tree('SBAR', [Tree('WHPP', [Tree('IN', ['at']), Tree('WHNP', [Tree('WP' , ['what'])])]), Tree('S', [Tree('NP', [Tree('NNS', ['institutions'])]), Tree('VP', [Tree( 'VBD', ['was']), Tree('NP', [Tree('NP', [Tree('NNP', ['Marshall']), Tree('NNP', ['Hall']) ]), Tree('NP', [Tree('DT', ['a']), Tree('NN', ['professor'])])])])])])])]
虽然在线演示是正确的版本:
如何获得使用在线演示获得的结果?
提前谢谢你!
【问题讨论】:
标签: stanford-nlp