【发布时间】:2018-08-06 08:16:26
【问题描述】:
我有一个带有逗号分隔符的 CSV 文件,需要在字符串中删除此分隔符以操作数据。
文件如下:
Col1, Col2, Col3, Col4
100, 08 科学, "xx, yy, ww", 美国
110、06文化,“abc, ww”,美国
115, 05 地质学,“地质学”,加利福尼亚州
我需要扫描字符串以替换分隔符,但不知道如何继续。 我试过 sed 's/","/" "/g' (使用 Mac OS 10.10)
因此,当我尝试保留某些列时,我无法达到预期的结果: 剪切 -d , -f 2,3 myfile.csv > newfile.csv
我得到了:
08科学,“xx
06文化,“abc
05地质学,《地质学》
代替
08科学,“xx、yy、ww”
06文化、《abc、ww》
05地质学,《地质学》
有什么帮助吗?
【问题讨论】:
-
麻烦的字段总是已知的 - 我的意思是,你能在一开始就说这次是字段 3 吗?是只有一个麻烦的字段,还是一行可以有两个双引号的字段?考虑将
awk添加到您的标签中,您会更快地得到答案... -
@Mark Setchell 要回答您的问题,是的,问题仅出现在有文本的字段 3 上。
-
@Sundeep 谢谢,我去看看
标签: macos csv unix awk delimiter