【发布时间】:2016-03-09 10:23:07
【问题描述】:
我有一个文件,我需要从中提取一条数据,由(可能)多行固定模式分隔
some data ... [my opening pattern
is here
and can be multiline] the data
I want to extract [my ending
pattern which can be
multiline as well] ... more data
这些模式在内容始终相同的意义上是固定的,除了它可以在单词之间包含新行。
如果我确信我的模式将被可预测地格式化,那么解决方案会很简单。
有没有办法将这种“模式”与流匹配?
有一个question 几乎是重复的,答案指向缓冲输入。我的情况的不同之处在于我知道模式中的确切字符串,除了单词也可能由换行符分隔(因此不需要\w* 类型的匹配)
【问题讨论】:
-
stackoverflow.com/a/28644645/918959 是一种适用于 巨大 文件的解决方案。你只需要做一个匹配括号的多行正则表达式。
-
一方面,您可以从文本中删除所有
/n。除此之外,如果您有非常大的文本并且开始和结束模式可能相距甚远,那么您引用的答案是正确的。 -
预期结果是什么?
the data I want to extract?
标签: python regex python-3.x pattern-matching