【发布时间】:2011-11-16 19:20:00
【问题描述】:
我正在尝试使用正则表达式从 SQL 导出文件中转储数据。为了匹配帖子内容的字段,我使用'(?P<content>.*?)'。它在大多数情况下都可以正常工作,但是如果该字段包含 '\n' 字符串,则正则表达式将不匹配。如何修改正则表达式以匹配它们?谢谢!
示例(我正在使用 Python):
>>> re.findall("'(?P<content>.*?)'","'<p>something, something else</p>'")
['<p>something, something else</p>']
>>> re.findall("'(?P<content>.*?)'","'<p>something, \n something else</p>'")
[]
附:似乎所有前面带有“\”的字符串都被视为转义字符。我怎样才能告诉 regx 按原样对待它们?
【问题讨论】:
标签: python regex escaping line-breaks