【发布时间】:2012-08-08 20:16:34
【问题描述】:
我有这段文字:
W/NNP Yes/NNP Get/NNP Paid/NNP for/IN Going/NNP to/TO College/NNP !/. 检查/NNP it/PRP out/RP here/RB !/. http/NN:/: //sldollar.notlong.com/JJ apple/NN iphone/NN TGIF/NNP 猪/NN 流感/NN
我目前正在使用这个正则表达式来捕获一些感兴趣的区域:
[a-zA-Z]*/NN[PS]* [a-zA-Z]*/NN[PS]*
我正在使用RegexPal 进行测试。
这会捕获TGIF/NNP swine/NN,但不会捕获swine/NN flu/NN。有关如何修复我的正则表达式以捕获此问题的任何建议?
【问题讨论】:
-
原因是有些匹配重叠了。
-
@Maulwurfn:是的。谢谢你。刚刚意识到这可以使用积极的前瞻来解决并发布我的答案。
-
@Maulwurfn:+1 感谢您的链接。
-
@tripleee:嗯,类似的,只是我没有处理垃圾邮件;)