【发布时间】:2018-09-05 04:28:31
【问题描述】:
我以以下两行为例,这是一个更大的数据集的一部分。该文件是使用竖线列分隔符限定的引用文本。你有太多引述的例子让我的导入崩溃了。
"BD 3 ML SYRINGE 18GX1-1/2""|"0"|""|"10"|"MISCELLANEOUS"
例如: 18GX1-1/2""| 应该是: 18GX1-1/2"|
"BD 3 ML SYRINGE 25GX1""|"0"|""|"10"|"MISCELLANEOUS"
例如: 25GX1""|应该是: 25GX1"|
我可以使用带有[\w]""| 的正则表达式在我的文件中轻松找到错误的所有实例
但是我找不到正确的表达式来简单地用一个 dbl 引号替换重复的双引号,用原始表达式替换找到的所有单词。
提前感谢您的任何建议!
【问题讨论】:
-
尝试
\w\K""\|并替换为"| -
Wiktor...我也会试一试,让您知道它是否有效!谢谢!