【发布时间】:2015-03-15 11:01:55
【问题描述】:
我正在使用 Stanford CoreNLP,但我知道它不支持句子分块。我正在寻找的是,给定一个输入句子,输出类似这样的内容:
[NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] .
我也知道 OpenNLP 显然支持此功能,但我已经使用 CoreNLP 编写了很多代码,我不想切换。因此,我正在寻找的是可以为我执行此操作的外部库,或者是关于以最简单的方式实现此功能的想法(参考出版物、链接,一切都是受欢迎的),从解析树开始。我不需要它像最先进的分块器那样准确,至少现在是这样,所以我希望快速实现它,如果需要的话,将来可能会改变它。
【问题讨论】:
-
我知道这个问题得到回答已经有一段时间了,但看看 nltk。它提供了简单的方法来分块甚至拼凑文本。 nltk.org/howto/chunk.html