【发布时间】:2019-02-04 18:20:51
【问题描述】:
我最近收到了一个来自数据库的 .csv 数据框,它本应返回 4 列,但实际上返回了 8 列。当我检查时,我发现添加了一些列,因为它看起来像是属于第四列有一个换行符。
换句话说,我看到的是这样的:
index A B C D (extra) (extra) (extra) (extra)
0 1 2 'abc\' 'def\' 'ghi\' 'jkl\' 'xyz' some_date
1 1 2 'abc' some_date
2 1 2 'abc\' 'def' some_date
与此相反:
index A B C D
0 1 2 'abcdefghijklxyz' some_date
1 1 2 'abc' some_date
2 1 2 'abcdef' some_date
有没有一种有效的方法来组合以换行符结尾的列和右侧的列?
【问题讨论】:
-
您能否澄清“将以换行符结尾的列与右侧的列组合起来”?您能给我们看一个 CSV 样本吗?
-
修复这样的 .csv 文件看起来很简单。您可以将 \' ' 替换为空。或者如果不知道空格的数量,你可以使用正则表达式'\ +'。我会使用 sed 预处理文件,或者只是在支持正则表达式的 gui 文本编辑器中进行替换,而不是使用 python。
标签: python newline concat string-concatenation