【问题标题】:How to extract only noun phrase from file using opennlp?如何使用opennlp从文件中只提取名词短语?
【发布时间】:2018-10-05 09:07:27
【问题描述】:

(TOP (NP (NP (NN john) (NNS works)) (PP (IN in) (NP (NN Kollam) (NN Kerala))))) 我得到了如上的输出。但我只想要名词短语。我无法处理文件。我该如何实现它。

【问题讨论】:

  • 你对名词有什么标准吗?即NN在这里代表名词?
  • //试试这个它会返回所有的名词 List allMatches = new ArrayList(); Matcher m = Pattern.compile("[(]NN (.*?)[)]") .matcher("(TOP (NP (NP (NN john) (NNS works))) (PP (IN in) (NP ( NN Kollam) (NN Kerala)))))"); while (m.find()) { allMatches.add(m.group()); } for(int i=0;i
  • Not noun 想要名词短语文件我无法实现它

标签: java opennlp


【解决方案1】:

你为什么使用解析器?你为什么不改用 Chunker 呢?试试:

$ echo "john works in Kollam Kerala." | opennlp TokenizerME en-token.bin | opennlp POSTagger en-pos.bin | opennlp ChunkerME en-chunker.bin

它显示:

 [NP john_NN works_NNS ] [PP in_IN ] [NP Kollam_NNP Kerala_NNP ] ._.

【讨论】:

  • 我正在使用 chunker ..但我也想要文件中的 NP .一个包含很多名词短语的文件 .SO 谁能做到
  • 我正在使用 chunker ..但我也想要文件中的 NP .一个包含很多名词短语的文件 .SO 谁能做到
猜你喜欢
  • 2015-03-29
  • 1970-01-01
  • 1970-01-01
  • 2011-05-09
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多