【发布时间】:2013-11-07 11:59:12
【问题描述】:
将日志文件拆分为由正则表达式分隔的块的最有效方法是什么。
日志文件包含多个请求/块(每个块的行数是可变的 - 取决于方法等)
识别前一个请求/块完成的唯一方法是通过 EOF 或另一个开始:使用特定消息。
我想要,使用正则表达式来分割整个文件并获取块,以便单独解析每个块。
日志文件的结构:
START_A_NEW_BLOCK_1:
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
START_A_NEW_BLOCK_2:
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
【问题讨论】:
标签: java regex file java.util.scanner