【发布时间】:2019-02-26 22:58:16
【问题描述】:
我从 Excel 电子表格中提取了一列,其中一些单元格包含多行,而有些则不包含。多行单元格由引号分隔。我想用“,”替换那些多行单元格中的返回。所以我的文件看起来像这样:
"Alpha
Beta
Gamma"
123
456
"Apple
Banana
Cherry"
789
this is a single-line cell
我的目标是
Alpha, Beta, Gamma
123
456
Apple, Banana, Cherry
789
this is a single-line cell
我可以编写一个使用嵌套模式捕获这些多行单元格的模式,但我不知道如何“到达内部”以获取反向引用。
"(([^"]+)\n)+([^"]+)"
【问题讨论】:
-
没有嵌套的反向引用。正则表达式不是这样工作的,重复的捕获组只在最后一次迭代中保持最后一次匹配。
-
我有一种感觉。谢谢。