【发布时间】:2016-01-14 06:26:26
【问题描述】:
我有一个格式如下的输入:我们在字符串的开头有任意数量的空格,然后我们有一个可以是任何东西的数据子字符串,它以非空格字符开头和结尾。在数据之后,我们再次有任意数量的空格(至少一个),一个数字和空格......
这个规范确实不准确,我想知道如何匹配它。在末尾匹配开头和结尾的空格和数字显然相当容易。最终的正则表达式如下所示:R("\s*(X)\s+([0-9]+)\s*)" 其中(X) 是完全匹配所有内容的东西。但是我不确定这个(X) 应该是什么样子。如何解决这个问题?
还有一件事 - 如果正则表达式匹配整行,那么最后的数据和数字是我想要获取的东西,所以仅仅找到一个数字不是解决方案。
澄清:在最终的正则表达式中,我想将子字符串和最终数字作为两个正则表达式组。
【问题讨论】:
-
这不是也匹配一个数字吗?我希望数据和数字是要匹配的单独数据“块”。
-
这是一个 .* 不能按预期工作的数据示例:
Foo234bar 456,然后我想抓取“Foo234bar”和“456”,这与“Foo234”匹配