【问题标题】:Stanford's CoreNLP inconsistency with online demo斯坦福的 CoreNLP 与在线演示不一致
【发布时间】:2017-07-10 02:13:34
【问题描述】:

我将 CoreNLP 的最新版本 [3.8.0] 与 python 包装器 [py-corenlp] 一起使用,当我使用以下注释器进行注释时,我意识到从 CoreNLP 获得的输出之间存在一些不一致: tokenize、ssplit、pos、depparse、parse,以及来自Online Demo 的输出。更重要的是,斯坦福的 Parser,无论是在我的代码中调用它还是在我在线运行它时,都给我与 CoreNLP 相同的结果。

例如,我有以下问题(借自 Free917 问题语料库):

Marshall Hall 在什么机构担任教授

使用 CoreNLP 我得到以下解析:

(ROOT\n (SBAR\n (WHPP (IN at)\n (WHNP (WDT what)))\n (S\n (NP (NNS机构))\n (VP (VBD)\n (NP\n (NP (NNP Marshall) (NNP Hall))\n (NP (DT a) (NN 教授)))))))

与斯坦福的解析器相同:

[Tree('ROOT', [Tree('SBAR', [Tree('WHPP', [Tree('IN', ['at']), Tree('WHNP', [Tree('WP' , ['what'])])]), Tree('S', [Tree('NP', [Tree('NNS', ['institutions'])]), Tree('VP', [Tree( 'VBD', ['was']), Tree('NP', [Tree('NP', [Tree('NNP', ['Marshall']), Tree('NNP', ['Hall']) ]), Tree('NP', [Tree('DT', ['a']), Tree('NN', ['professor'])])])])])])])]

虽然在线演示是正确的版本:

Online Demo Parsing

如何获得使用在线演示获得的结果?

提前谢谢你!

【问题讨论】:

    标签: stanford-nlp


    【解决方案1】:

    该演示运行 shift-reduce 解析器,该解析器更快、更准确,但代价是序列化模型大小 [大得多]。见https://nlp.stanford.edu/software/srparser.shtml

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-05-05
      • 2019-03-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多