【问题标题】:Chunking NP, VP and PP phrases in Java (CoreNLP)在 Java (CoreNLP) 中分块 NP、VP 和 PP 短语
【发布时间】:2015-03-15 11:01:55
【问题描述】:

我正在使用 Stanford CoreNLP,但我知道它不支持句子分块。我正在寻找的是,给定一个输入句子,输出类似这样的内容:

 [NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] . 

我也知道 OpenNLP 显然支持此功能,但我已经使用 CoreNLP 编写了很多代码,我不想切换。因此,我正在寻找的是可以为我执行此操作的外部库,或者是关于以最简单的方式实现此功能的想法(参考出版物、链接,一切都是受欢迎的),从解析树开始。我不需要它像最先进的分块器那样准确,至少现在是这样,所以我希望快速实现它,如果需要的话,将来可能会改变它。

【问题讨论】:

  • 我知道这个问题得到回答已经有一段时间了,但看看 nltk。它提供了简单的方法来分块甚至拼凑文本。 nltk.org/howto/chunk.html

标签: java nlp


【解决方案1】:

最后我找到了the Illinois chunker,这正是我所需要的。

【讨论】:

  • 对 Python 用户有什么建议吗?我知道 nltk,但它需要一些我自己制作的分块正则表达式。
猜你喜欢
  • 2013-06-06
  • 2016-02-17
  • 1970-01-01
  • 1970-01-01
  • 2019-01-31
  • 2013-10-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多