【发布时间】:2016-10-31 14:13:41
【问题描述】:
假设我有以下代码:
TokenSequencePattern p = TokenSequencePattern.compile("[{tag:/JJ.*/}] [{tag:/NN.*/}]");
TokenSequenceMatcher m = tPattern.getMatcher(coreLabelList);
while (tMatcher.find()){
List<CoreMap> matches = m.groupNodes();
}
我想在这里捕捉的是一个形容词后跟一个名词,即它必须以一个形容词开头,并且必须以一个名词结尾。例如,如果我有“漂亮的围巾”,它应该是匹配的,但如果我有“漂亮的带白点的围巾”,则不应该是匹配的。目前,上面的标记正则表达式与这两个短语都匹配。如何指定序列的确切开始和确切结束?
【问题讨论】:
-
这给出了相同的结果
标签: java regex stanford-nlp