【发布时间】:2015-11-25 03:04:02
【问题描述】:
我有一个包含文本的 CSV 列数据。每行用双引号分隔"
一行中的示例文本与此类似(注意:新行和每行之前的空格是有意的)
"Lorem ipsum dolor sit amet,
consectetur adipisicing elit, sed do eiusmod
tempor incididunt ut labore et dolore magna
aliqua. Ut ""enim ad"" minim veniam,
quis nostrud exercitation ullamco laboris nisi
ut aliquip ex ea commodo
consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse
cillum dolore eu fugiat ""nulla pariatu"""
"ex ea commodo
consequat. Duis aute irure ""dolor in"" reprehenderit
in voluptate velit esse
cillum dolore eu fugiat nulla pariatur.
Excepteur sint occaecat cupidatat non
proident, sunt in culpa qui officia deserunt
mollit anim id est laborum."
以上代表2个后续行。
我想选择每个第一个双引号 "(开始一行)和每个最后一个双引号 " 之间包含的所有文本作为单独的组
如您所见,文本中有换行符,以及随后的转义双引号 "" 这是我需要选择的文本的一部分。
我想出了这样的东西
(?s)(?!")[^\s](.+?)(?=")
但是多个双引号破坏了我想要的匹配
我是一个真正的正则表达式新手,所以我想我可能遗漏了一些非常基本的东西。不知道是否相关,但我使用的是 Sublime Text 3,所以我认为应该是 python。
我能做些什么来达到我的需要?
【问题讨论】:
标签: python regex csv sublimetext3 double-quotes