斯坦福的 CoreNLP 与在线演示不一致答案

【问题标题】：Stanford's CoreNLP inconsistency with online demo斯坦福的 CoreNLP 与在线演示不一致
【发布时间】：2017-07-10 02:13:34
【问题描述】：

我将 CoreNLP 的最新版本 [3.8.0] 与 python 包装器 [py-corenlp] 一起使用，当我使用以下注释器进行注释时，我意识到从 CoreNLP 获得的输出之间存在一些不一致： tokenize、ssplit、pos、depparse、parse，以及来自Online Demo 的输出。更重要的是，斯坦福的 Parser，无论是在我的代码中调用它还是在我在线运行它时，都给我与 CoreNLP 相同的结果。

例如，我有以下问题（借自 Free917 问题语料库）：

Marshall Hall 在什么机构担任教授

使用 CoreNLP 我得到以下解析：

(ROOT\n (SBAR\n (WHPP (IN at)\n (WHNP (WDT what)))\n (S\n (NP (NNS机构))\n (VP (VBD)\n (NP\n (NP (NNP Marshall) (NNP Hall))\n (NP (DT a) (NN 教授)))))))

与斯坦福的解析器相同：

[Tree('ROOT', [Tree('SBAR', [Tree('WHPP', [Tree('IN', ['at']), Tree('WHNP', [Tree('WP' , ['what'])])]), Tree('S', [Tree('NP', [Tree('NNS', ['institutions'])]), Tree('VP', [Tree( 'VBD', ['was']), Tree('NP', [Tree('NP', [Tree('NNP', ['Marshall']), Tree('NNP', ['Hall']) ]), Tree('NP', [Tree('DT', ['a']), Tree('NN', ['professor'])])])])])])])]

虽然在线演示是正确的版本：

Online Demo Parsing

如何获得使用在线演示获得的结果？

提前谢谢你！

【问题讨论】：

标签： stanford-nlp

【解决方案1】：

该演示运行 shift-reduce 解析器，该解析器更快、更准确，但代价是序列化模型大小 [大得多]。见https://nlp.stanford.edu/software/srparser.shtml

【讨论】：