【发布时间】:2013-01-02 12:10:02
【问题描述】:
我正在尝试使用 numpy.recfromcsv(...) 读取 CSV 文件,其中某些字段中有逗号。包含逗号的字段用引号括起来,即"value1, value2"。 Numpy 将引用的字段视为两个不同的字段,并且效果不佳。我现在使用的命令是
data = numpy.recfromcsv(dataFilename, delimiter=',', autstrip=True)
我发现了这个问题
但它不使用numpy,我真的很想使用它。
所以我希望这里至少有几个选项之一:
-
numpy.recfromcsv(...)有哪些选项可以让我将带引号的字段读取为一个字段,而不是多个逗号分隔的字段? - 我应该以不同的方式格式化我的 CSV 文件吗?
- (或者,但不理想)按照引用的问题读取 CSV,并通过额外步骤创建
numpy数组。
请指教。
【问题讨论】:
-
也许
pandas.read_csv是一个选项 -
查看今天回答的其他问题stackoverflow.com/questions/14396362/…。建议将整个文件作为单行读取并以 '\n' 作为分隔符的答案,然后定义一个自定义转换器函数,将每行拆分为其元素可能是要走的路。