【发布时间】:2014-02-25 00:05:57
【问题描述】:
我在 python 中编写了一个 HTML 解析器,用于提取数据,使其在 csv 文件中看起来像这样:
itemA, itemB, itemC, Sentence that might contain commas, or colons: like this,\n
所以我使用了分隔符“:::::”,认为它不会在数据中被挖掘
itemA, itemB, itemC, ::::: Sentence that might contain commas, or colons: like this,::::\n
这适用于数千行中的大多数,但是,显然是一个冒号:当我在 Calc 中导入 csv 时抵消它。
我的问题是,在创建包含许多需要用某些定界符分隔的句子变体的 csv 时,最好使用或唯一的定界符是什么?我是否正确理解分隔符,因为它们分隔 CSV 中的值?
【问题讨论】:
-
在数据中使用的集合之外使用分隔符,例如
chr(255)。 -
@martineau 我使用了一个不常见的序列作为分隔符 (~~~) 但在未来我相信这是最好的答案!您如何将 chr(255) 写入文件? output.write(chr(255))?
-
是的,您可以通过
chr(255)编写它,或者在使用csvmodule 时通过关键字参数delimiter=chr(255)指定使用它。您希望我将此添加为答案吗? -
@martineau 我会选择它作为答案:)
标签: python csv delimiter openoffice-calc