【问题标题】:repeating regex pattern in java在java中重复正则表达式模式
【发布时间】:2015-10-05 07:03:35
【问题描述】:

我想读取一个包含以下内容的文本文件,我正在尝试使用正则表达式来匹配并将内容拆分为 2 个优先级队列的不同字符串,以制作基于堆的优先级队列任务调度程序。但首先,我需要确保格式在我使用扫描仪读取的文本文件中是正确的,它从包含字母数字字母的任务开始,后跟一个非负整数(到达时间)和一个自然数(截止时间)。以下是文本文件中正确格式的输入:

task1 2 3 task2 2 3 task3 2 3 task4 4 5 task5 4 5
task6 7 9 task7 7 9 task8 7 9 task9 7 9
task10 7 9 task11 7 9 task12 7 9 task13 7 9
task14 7 9 task15 7 9 task16 10 11 task17 10 11
task18 10 11 task19 10 11  task20 10 12

我尝试了以下正则表达式代码来尝试检查格式是否正确,但我只能将其匹配到第一个任务属性。除了第一个任务之外,我似乎无法匹配它,这意味着当它继续执行格式重复的其他任务时,正则表达式将失败。知道我的正则表达式有什么问题吗?

(^\s*[a-zA-Z0-9]*\s+\d+\s+\d+\s*){1,}

^ 以任意空格\s* 0 次或更多次开始

[a-zA-Z0-0]*是字母数字0或多次,指的是任务

\s+是不同任务属性之间的空格

\d+是到达时间和截止时间

\s* 以空格结尾,不同任务之间出现 0 次或多次

() 括号后的{1,} 指定最小重复次数为 1,没有指定最大重复次数

【问题讨论】:

    标签: java regex pattern-matching repeat


    【解决方案1】:

    问题是^,它要求匹配位于输入序列的开头,并且除了第一个匹配之外的任何匹配都不会满足该条件。

    尝试将第一部分移出组:

    ^\s*([a-zA-Z0-9]*\s+\d+\s+\d+\s*){1,}
    

    顺便说一句,{1,} 可以替换为单个 +

    另请注意,根据您应用正则表达式的方式,您可能不需要使用 ^$ 包装表达式(例如 String.matches()Matcher.matches 隐式执行),或者您可能必须去做(取决于你的需要),例如在末尾添加 $ 以要求在匹配后不允许任何内容(如果这会违反您的文件格式)。

    如果您还想提取匹配项,则需要稍微不同的方法,即使用 Matcher.find() 并删除最后一部分 ({1,})。

    【讨论】:

      猜你喜欢
      • 2014-01-24
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-11-16
      • 2016-01-11
      相关资源
      最近更新 更多