【发布时间】:2018-01-24 22:38:23
【问题描述】:
我正在尝试为一组单词编写一个正则表达式。我只想选择具有一个或多个重复子字符串的单词。
例如,在以下单词中:
香蕉 baba nano nana nanna
我只想选择单词banana、baba、nana 而不想要选择nano 和nanna。我想在这里找到的是包含 ba 或 na 一次或多次的单词,而不是包含一个或多个 ba 实例以外的任何内容的单词 或 na。因此,不应选择 nanna,因为它在两个 na 之间包含一个额外的 n。
我尝试了很多正则表达式,但找不到确切的结果。 到目前为止,这是我坚持的正则表达式。
\w+(ba|na)
这也选择了我不想要的 nanna。我是 regex 的新手,已经尝试了很多示例和教程,也环顾了一段时间。
P.S 我正在使用this website 来测试我的正则表达式。
【问题讨论】:
标签: regex search nlp regular-language