【发布时间】:2016-10-20 15:05:55
【问题描述】:
我有一个文本,我需要在其中抓取数据并将其拆分。我需要在一大组文本中找到“审阅频率”,然后一旦找到,将其后面的所有内容都放在“)”处。
示例文本是:
No. of components Variable
Review frequency Quarterly (Mar., Jun., Sep., Dec.)
Quick facts
To learn more about the
我需要的是“季刊”和“3 月、6 月、9 月、12 月”
我目前的正则表达式是:
((?=.*?\bReview frequency\b)(\b(Q|q)uarterly|(A|a)nnually|(S|s)emi-(A|a)nnually))
但这不起作用。本质上,在我们开始获取其他信息之前,“审查频率”需要成为限定符,因为文件中可能还有其他日期/时间段。谢谢!
【问题讨论】:
-
你要不要--re.search(r'.*查看频率(.*)', line).group(1)
-
Try (Review frequency)(.+) 请注意,如果您想要在“Review frequency”之后的内容换行,这将不起作用。
标签: python regex python-2.7 regex-lookarounds