【发布时间】:2011-03-11 23:38:22
【问题描述】:
这是对已回答的相关问题的扩展 Here
我有一个需要解析的每周 csv 文件。它看起来像这样。
"asdf","asdf","asdf","asdf"
但有时有些文本字段包含一个额外的非转义双引号字符串
"asdf","as "something" df","asdf","asdf"
从这里的其他帖子中,我能够整理出一个正则表达式
(?m)""(?![ \t]*(,|$))
匹配两个连续的双引号,只有“如果它们前面没有逗号或行尾,中间有可选的空格和制表符”
现在这只会找到连续的双引号。如何修改它以查找和替换/删除文件中“某物”周围的双引号?
谢谢。
【问题讨论】:
-
无论您使用哪种语言,几乎可以肯定已经有了 CSV 解析器 - 您是否检查过它是否已经能够处理格式错误的输入? (从而避免您重新发明轮子)
-
我没有使用任何编程语言,它是一个过程的一部分,它基本上每天都会自动处理一堆文件以进行批处理。客户端使用名为 winautomation 的自动化程序,该程序基本上具有内置的替换文本操作,该操作在查找/替换参数中接受 .NET 风格的正则表达式。
-
好的,所有这些都应该是问题的一部分——尤其是“.NET 风味正则表达式”部分。
标签: regex programming-languages csv expression