使用 Pandas 导入文件时出现列问题答案

【问题标题】：Problem with columns when importing file with Pandas使用 Pandas 导入文件时出现列问题
【发布时间】：2021-07-16 13:24:24
【问题描述】：

在 Pandas 上导入文本文件时遇到问题。当我在文本中打开文件时，列没有问题，但是当我用 Pandas 打开时，我无法拆分列并且 Jupiter-notebook 将其识别为一列。我想要三列标题为'Z'H'和'err'。what will give me when I open the saved file

data= np.genfromtxt('/path/hubel.dat')
df=pd.DataFrame(data)
df.columns= ['Z', 'H', 'err']
df_groupby_err=df.groupby("err")
for err, H  in df.groupby("err"):
    if err<20:
        print( )
        print( H )
        print( ) 
f=open("hubble_error_edited-2.txt", "w")
for err, H in df.groupby("err"):
    if err<20:
        f.write("\n"+str(H)+""+ "\n")
f.close()
data= pd.read_csv("/path/hubble_error_edited-2.txt" )

【问题讨论】：

如果我理解你的程序，你将数据读入数据帧，然后 groupby 并写出每个组的字符串表示（空格分隔），然后尝试使用 read_csv 当你没有逗号分隔值。
您的minimal reproducible example 应始终包含数据的最小示例。为什么选择 numpy.genfromtxt 而不是 Pandas I/O tools 之一？

标签： python pandas dataframe split

【解决方案1】：

您可以尝试在separator参数中添加blank space：

data= pd.read_csv("/path/hubble_error_edited-2.txt", sep=' ')

【讨论】：