【发布时间】:2016-08-04 15:32:39
【问题描述】:
我注意到我收到的几个 CSV 在文件中放置了随机的“NUL”值。我注意到这一点是因为当我使用 SSIS 包将文件导入数据库时,我构建这些文件时会抛出 no column delimiter found 错误。我正在考虑编写一个 python 脚本来清理这些文件,但是我在 Python 中找不到解决这个问题的方法。我将如何使用 Python 删除这些 NUL 字符?
我会附上一张图片,但我没有足够的声誉来附上一张。
例如。
"123456","Brown, Jim","","?NUL","",False,"8/16/2014 12:00:00 AM",""NUL,""InboNULund"
【问题讨论】:
-
您是说有一个
\x00字符作为CSV 元素吗?即foo,bar,\x00,tree? -
@theorifice 是的。但也有
\x00字符插入字符串,即foo\x00bar, cheese, pizza, y\x00ellow -
您是否尝试过遍历文件中的行并使用
string.replace方法? -
@haliphax 我有,但并非所有
\x00字符都嵌入在字符串中。它并没有捕捉到所有这些。 -
生成数据的是什么?似乎问题在于 CSV 生成器提供了乱码数据。
标签: python-2.7 csv nul