【发布时间】:2012-05-04 11:40:01
【问题描述】:
使用 Java 和 Regex 解析随机字符串以查找重复序列。
考虑字符串:
aaabbaaacccbb
我想找到一个正则表达式,它会在上面的字符串中找到所有匹配项:
aaabbaaacccbb
^^^ ^^^
aaabbaaacccbb
^^ ^^
什么是正则表达式,它将检查字符串中是否存在任何重复的字符序列并返回这些重复字符的组,例如组 1 = aaa 和组 2 = bb。另请注意,我使用了示例字符串,但任何重复字符都是有效的: 罗恩乔乔 ... ... ,, ,,...,,
【问题讨论】:
-
似乎使用像this这样的基于字典的字符串搜索算法会更好,因为你一开始不知道模式。
-
重复序列是否需要连续? “RonBobRonJoe”是否应该返回“Ron”?
-
RonBobRonBobAbeRonBobRonBobAbe或XXYYXY应该返回什么? -
“重复字符序列”与“重复字符序列”的意思是一样的吗?
标签: java regex pattern-matching