【发布时间】:2015-10-15 12:34:16
【问题描述】:
我编写了以下代码来转置包含数字和字母的数据文件:
import pandas as pd
from pandas import DataFrame
def step2(file1,file2):
source=pd.read_csv(file1,header=None,engine='python')
dest=source.transpose()
dest.to_csv(file2,sep="\t",header=None, index=None,quoting=3)
现在它总是在输出文件中产生双引号,我阅读了熊猫文档并使用了 doublequotes=None 之类的偶数选项,但仍然产生引号。该文件还提到,为了设置quoting=None,代码应该包含一些转义字符。我尝试将\n 设置为转义字符,然后它确实转义了引号,但在每个元素之后添加了分隔字符。
如何从熊猫 csv 输出中删除双引号?
以下是输入
AU AA GG CC 00 AA TT
以下是设置doublequotes=False并从上面的代码中删除quoting=3选项后的输出
AU
AA
GG
CC
0
AA
TT
我无法解释代码的行为,它将 00 更改为 0。我正在寻求指导,关于此输出的另一件有趣的事情是:当我使用以下文件格式时:
AU AA GG CC 00 AA
AK AA GG CC AA 00
上述代码似乎可以正常工作:
AU AK
AA AA
GG GG
CC CC
00 AA
AA 00
谁能指导我为什么我在使用单行时得到不同的输出?
【问题讨论】:
-
不应该是
doublequote=False吗?当您将quoting从默认的None更改为3时,您还可以发布您想要的输出吗 -
你当前的输入是什么?
-
你用的是什么版本的python?
-
Python 3.4.3 和 Anaconda 2.3.0