【发布时间】:2014-01-31 00:39:29
【问题描述】:
我正在使用表达式 [A-F]{4} 来尝试检查 unix 上名为“words”的字典文件。问题是现在它检查所有字符以找到 A-F 的四个字母组合(这意味着我可以获得与表达式匹配的单词的一部分),我需要它来仅查找与此匹配的单词。我会检查表达式后面的空格,但问题是每个单词都在一个新行上,并且后面不包含空格。
那么有没有一种方法可以检查它们是否是在我寻求与正则表达式的组合之后的换行符,就像你可以使用空格一样?
如果不存在换行的可能性并且任何人都知道一个聪明的技巧,我正在用 java 编写我的代码。
将 \b 添加到表达式中的代码:http://pastebin.com/kYqr6Ex6
【问题讨论】:
-
您要匹配的示例字符串(或段落)是什么?
-
这些(不知道如何格式化,所以这里也放在pastebin上:pastebin.com/CtQvSWAF): beechnut's beechnuts beef beef's beefburger 它需要匹配“牛肉”,没有一个其他的话。 (因为单词超过 4 个字符。现在(没有 \b)它是前两个单词的一部分 beec 两次,beec 三次(一次是牛肉,两次是另外两个单词的一部分)